HiTZ Zentroa desarrolla el mayor modelo de lenguaje para el euskera: Latxa

27/02/2024

Esta primera versión, desarrollada por el centro socio de LANGUNE, será esencial para construir herramientas para el gran público como chatbots.

Card image cap

Un modelo grande de lenguaje, o LLM en Inglés, es un tipo de modelo de inteligencia artificial que emplea técnicas de aprendizaje automático para comprender y generar lenguaje humano, basándose en el conocimiento obtenido de conjuntos de datos masivos. El euskera cuenta ya con su gran modelo de lenguaje: Latxa. Está basado en los modelos LLaMA de Meta y reúne modelos de entre 7 y 70 mil millones de parámetros. Los LLMs de hoy en día tienen un impresionante rendimiento en idiomas con muchos recursos; por ejemplo, ChatGPT o Bard-s en inglés. Pero en el caso del euskera y otros idiomas con pocos recursos, su rendimiento deja mucho que desear. Este hecho aumenta la brecha tecnológica entre idiomas con muchos y pocos recursos, al menos en cuanto a herramientas digitales. HiTZ, Centro Vasco de Tecnología del Lenguaje de la UPV/EHU y socio de LANGUNE, ha desarrollado Latxa con el objetivo de superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan con euskera basado en LLMs. Este trabajo ha recibido el apoyo del Gobierno Vasco, dentro del proyecto IKER-GAITU.

Más información

Noticias relacionadas

El congreso 'Hizkuntzen irabazia’ pondrá en valor la contribución de las lenguas a la economía

08/10/2024

LANGUNE está encargándose de la organización del congreso junto a FUEN

Iametza organiza la 13a edición de Euskarabildua

02/10/2024

El tema de este año será 'La tecnología que no es artificial' y reivindicará un uso más ético, sostenible y viable de la tecnología