HiTZ Zentroa développe le plus grand modèle de langage pour l’euskera : Latxa

27/02/2024

Cette première version élaborée par le centre partenaire de LANGUNE sera essentiel pour construire des outils destinés au grand public comme les chatbots.

Card image cap

Un grand modèle de langage, ou LLM en anglais, est un type de modèle d’intelligence artificielle qui utilise des techniques d'apprentissage automatique pour comprendre et créer du langage humain en se basant sur la connaissance acquise de l'ensemble des données massives. L’euskera dispose d’ores et déjà de son propre grand modèle de langage : Latxa. Il est basé sur les modèles LLaMA de Meta et rassemble des modèles de 7 à 70 milliards de paramètres. Les LLM d’aujourd’hui donnent des résultats impressionnants dans les langues qui disposent d’un grand nombre de ressources, par exemple ChatGPT ou Bard-s en anglais. Mais dans le cas de l’euskera et d'autres langues n’ayant que peu de ressources, leurs performances laissent beaucoup à désirer. Ce fait vient encore creuser le fossé technologique entre les langues disposant de beaucoup et de peu de ressources, du moins concernant les outils numériques. HiTZ, Centre basque de technologie du langage de l'UPV/EHU  et partenaire de LANGUNE, a développé Latxa dans un objectif : dépasser ces limites et encourager le développement de la recherche, des innovations et des produits fonctionnant avec l’euskera basé sur des LLM. Ce travail a reçu le soutien du Gouvernement basque dans le cadre du projet IKER-GAITU.

En savoir plus



Actualités similaires

L'UEU proposera un cours de troisième cycle d’Euskera et Numérisation pendant l'année 2024/25

05/06/2024

Il s'agira d'un cours de troisième cycle en ligne pour former les personnes souhaitant promouvoir l'euskara dans le contexte numérique.

TISA, Elhuyar et LANGUE à l’Assemblée générale d’ANETI

31/05/2024

Le 23 mai, ANETI, Association nationale d'entreprises de traduction et d’interprétation a tenu son Assemblée générale à Barcelone.

Cas d’utilisation de fort impact des technologies du langage

09/05/2024

Langune, aux côtés d’Emun et le centre HITZ ont réalisé 17 interviews et reçu 282 réponses à leur questionnaire.