Skip to content

Clemente-H/Faisan

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Faisan: Mejora de Capacidades del Modelo Falcon-7B para el Español

Faisan es una extensión del modelo de lenguaje Falcon-7B, originalmente parte de la familia Falcon desarrollada por el Technology Innovation Institute de Abu Dhabi. Esta versión se especializa en mejorar la comprensión y generación de texto en español mediante un proceso de pre-entrenamiento secundario y ajuste fino con datos en español.

Innovaciones

  • Preentrenamiento Secundario y Fine-Tuning: Utilizamos un conjunto diverso de corpus no anotados en español y otros datos específicos para ajustar el modelo, omitiendo técnicas como token augmentation.
  • Evaluación con MT-Bench Español: Proporcionamos una adaptación del MT-Bench al español para evaluar el rendimiento de Faisan en comparación con otros modelos de gran tamaño.

Modelos

Conjuntos de Datos

Resultados de Evaluación

Los resultados muestran una mejora en la comprensión y generación de texto en español, con un incremento de hasta 2.6 puntos en MT-Bench en algunas tareas.

Conclusiones

El modelo Faisan-7B muestra mejoras significativas en la comprensión y generación de texto en español. Aunque no supera en todas las tareas al modelo Falcon-7B original en inglés, demuestra la capacidad de funcionar eficazmente en escenarios específicos como el roleplay en español.

About

Falcon-in-spanish

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages