HiTZ Zentroa desarrolla el mayor modelo de lenguaje para el euskera: Latxa

27/02/2024

Esta primera versión, desarrollada por el centro socio de LANGUNE, será esencial para construir herramientas para el gran público como chatbots.

Card image cap

Un modelo grande de lenguaje, o LLM en Inglés, es un tipo de modelo de inteligencia artificial que emplea técnicas de aprendizaje automático para comprender y generar lenguaje humano, basándose en el conocimiento obtenido de conjuntos de datos masivos. El euskera cuenta ya con su gran modelo de lenguaje: Latxa. Está basado en los modelos LLaMA de Meta y reúne modelos de entre 7 y 70 mil millones de parámetros. Los LLMs de hoy en día tienen un impresionante rendimiento en idiomas con muchos recursos; por ejemplo, ChatGPT o Bard-s en inglés. Pero en el caso del euskera y otros idiomas con pocos recursos, su rendimiento deja mucho que desear. Este hecho aumenta la brecha tecnológica entre idiomas con muchos y pocos recursos, al menos en cuanto a herramientas digitales. HiTZ, Centro Vasco de Tecnología del Lenguaje de la UPV/EHU y socio de LANGUNE, ha desarrollado Latxa con el objetivo de superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan con euskera basado en LLMs. Este trabajo ha recibido el apoyo del Gobierno Vasco, dentro del proyecto IKER-GAITU.

Más información

Noticias relacionadas

Cámara de Gipuzkoa premia a MLAKoop

24/04/2024

La institución cameral distingue a MLAKoop, empresa asociada de LANGUNE, como empresa de servicios de 2024 en el marco de la edición de este año de los Premios a la Empresa de Gipuzkoa.

LANGUNE mira hacia delante

28/02/2024

El 2023 ha sido un año de consolidación para LANGUNE: ha conseguido nuevos socios, ha firmado un convenio de colaboración y ha participado en diferentes jornadas y eventos.

El Congreso Languages Lanean reunió a más de 500 personas

28/02/2024

LANGUNE fue la encargada de gestionar la secretaría técnica del Congreso Languages Lanean organizado por el Gobierno Vasco.