HiTZ Zentroa desarrolla el mayor modelo de lenguaje para el euskera: Latxa

27/02/2024

Esta primera versión, desarrollada por el centro socio de LANGUNE, será esencial para construir herramientas para el gran público como chatbots.

Card image cap

Un modelo grande de lenguaje, o LLM en Inglés, es un tipo de modelo de inteligencia artificial que emplea técnicas de aprendizaje automático para comprender y generar lenguaje humano, basándose en el conocimiento obtenido de conjuntos de datos masivos. El euskera cuenta ya con su gran modelo de lenguaje: Latxa. Está basado en los modelos LLaMA de Meta y reúne modelos de entre 7 y 70 mil millones de parámetros. Los LLMs de hoy en día tienen un impresionante rendimiento en idiomas con muchos recursos; por ejemplo, ChatGPT o Bard-s en inglés. Pero en el caso del euskera y otros idiomas con pocos recursos, su rendimiento deja mucho que desear. Este hecho aumenta la brecha tecnológica entre idiomas con muchos y pocos recursos, al menos en cuanto a herramientas digitales. HiTZ, Centro Vasco de Tecnología del Lenguaje de la UPV/EHU y socio de LANGUNE, ha desarrollado Latxa con el objetivo de superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan con euskera basado en LLMs. Este trabajo ha recibido el apoyo del Gobierno Vasco, dentro del proyecto IKER-GAITU.

Más información

Noticias relacionadas

Curso de verano sobre comunicación multilingüe transfronterizo

11/04/2025

La Ciudad de las Artes de Baiona acogerá el 2 de julio de 2025 un curso de verano transfronterizo sobre comunicación multilingüe.

LANGUNE presenta el estudio de casos de uso de tecnologías lingüísticas de alto impacto

08/04/2025

El Centro Vasco de Tecnología de la Lengua de la Universidad del País Vasco (UPV/EHU), en colaboración con la cooperativa EMUN y Langune, ha llevado a cabo un estudio que ha tenido como objetivo identificar casos de uso de alto impacto en las tecnologías lingüísticas.