HiTZ Zentroa desarrolla el mayor modelo de lenguaje para el euskera: Latxa

27/02/2024

Esta primera versión, desarrollada por el centro socio de LANGUNE, será esencial para construir herramientas para el gran público como chatbots.

Card image cap

Un modelo grande de lenguaje, o LLM en Inglés, es un tipo de modelo de inteligencia artificial que emplea técnicas de aprendizaje automático para comprender y generar lenguaje humano, basándose en el conocimiento obtenido de conjuntos de datos masivos. El euskera cuenta ya con su gran modelo de lenguaje: Latxa. Está basado en los modelos LLaMA de Meta y reúne modelos de entre 7 y 70 mil millones de parámetros. Los LLMs de hoy en día tienen un impresionante rendimiento en idiomas con muchos recursos; por ejemplo, ChatGPT o Bard-s en inglés. Pero en el caso del euskera y otros idiomas con pocos recursos, su rendimiento deja mucho que desear. Este hecho aumenta la brecha tecnológica entre idiomas con muchos y pocos recursos, al menos en cuanto a herramientas digitales. HiTZ, Centro Vasco de Tecnología del Lenguaje de la UPV/EHU y socio de LANGUNE, ha desarrollado Latxa con el objetivo de superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan con euskera basado en LLMs. Este trabajo ha recibido el apoyo del Gobierno Vasco, dentro del proyecto IKER-GAITU.

Más información

Noticias relacionadas

LANGUNE organizará el congreso ‘Hizkuntzen irabazia’ junto a FUEN

08/10/2024

Se celebrará el 26 y 27 de noviembre en el Palacio de Concresos Kursaal

Iametza organiza la 13a edición de Euskarabildua

02/10/2024

El tema de este año será 'La tecnología que no es artificial' y reivindicará un uso más ético, sostenible y viable de la tecnología

Viviendo en el plurilingüismo: Las lenguas minoritarias nos fortalecen

26/09/2024

La lucha por la supervivencia y el desarrollo del plurilingüismo ha creado una importante industria de las lenguas en Euskal Herria.