HiTZ Zentroa desarrolla el mayor modelo de lenguaje para el euskera: Latxa

27/02/2024

Esta primera versión, desarrollada por el centro socio de LANGUNE, será esencial para construir herramientas para el gran público como chatbots.

Card image cap

Un modelo grande de lenguaje, o LLM en Inglés, es un tipo de modelo de inteligencia artificial que emplea técnicas de aprendizaje automático para comprender y generar lenguaje humano, basándose en el conocimiento obtenido de conjuntos de datos masivos. El euskera cuenta ya con su gran modelo de lenguaje: Latxa. Está basado en los modelos LLaMA de Meta y reúne modelos de entre 7 y 70 mil millones de parámetros. Los LLMs de hoy en día tienen un impresionante rendimiento en idiomas con muchos recursos; por ejemplo, ChatGPT o Bard-s en inglés. Pero en el caso del euskera y otros idiomas con pocos recursos, su rendimiento deja mucho que desear. Este hecho aumenta la brecha tecnológica entre idiomas con muchos y pocos recursos, al menos en cuanto a herramientas digitales. HiTZ, Centro Vasco de Tecnología del Lenguaje de la UPV/EHU y socio de LANGUNE, ha desarrollado Latxa con el objetivo de superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan con euskera basado en LLMs. Este trabajo ha recibido el apoyo del Gobierno Vasco, dentro del proyecto IKER-GAITU.

Más información

Noticias relacionadas

Elhuyar organiza un taller sobre traducción y tecnología en la UIK

21/06/2024

El taller, de dos días de duración, analizará el impacto que las tecnologías más recientes están teniendo en el sector de la traducción.

La UEU ofrecerá un posgrado de Euskera y Digitalidad el curso 2024/25

05/06/2024

Será un posgrado online para formar a quienes quieran fomentar el euskera en el contexto digital.

TISA, Elhuyar y LANGUNE en la Asamblea General de ANETI

31/05/2024

El 23 de mayo ANETI, la Asociación Nacional de Empresas de Traducción e Interpretación, celebró su Asamblea General en Barcelona.