Esta API permite generar texto a partir de entradas de texto o audio utilizando un proceso de múltiples agentes. Hay dos endpoints disponibles:
Nota: Reemplazar env.example por .env.local con los valores correspondientes
pip install -r requirements.txt
python app/start.py
Todos los endpoints requieren autenticación usando un Bearer token. Incluye el siguiente header en todas tus solicitudes:
Authorization: Bearer <token>
El token debe ser válido y pertenecer a un usuario registrado como tester. Los tokens inválidos o usuarios no autorizados recibirán un error 401.
Endpoint: /convert_text_v2
Método: POST
Descripción: Este endpoint acepta una entrada de texto y la procesa a través de múltiples agentes para generar un nuevo texto.
{
"text": "Hubo un choque en callao y santa fe, creo que el conductor estaba ebrio, no hubo muertos, ni heridos"
}
text
(string): El texto de entrada que se desea procesar.
Authorization: Bearer <tu_token_aquí>
Content-Type: application/json
La respuesta será el texto generado en HTML después de pasar por los múltiples agentes.
Endpoint: /convert_audio_v2
Método: POST
Descripción: Este endpoint acepta un archivo de audio y lo transcribe utilizando Whisper. Luego, el texto transcrito se procesa a través de múltiples agentes para generar un nuevo texto.
file
(archivo, form-data): El archivo de audio que se desea transcribir y procesar.
Authorization: Bearer <tu_token_aquí>
Content-Type: multipart/form-data
La respuesta será el texto generado después de transcribir el audio y procesarlo a través de los múltiples agentes.
Tiempo de procesamiento estimado: de 1 a 3 minutos.
- El archivo de audio debe estar en un formato compatible con Whisper (por ejemplo, WAV, MP3, etc.).
- Asegúrate de incluir el token de autenticación en todas las solicitudes.
- Si recibes un error 401, verifica que tu token sea válido y que tu usuario esté registrado como tester.