HiTZ Zentroak euskararentzako hizkuntza eredurik handiena garatu du: Latxa

2024/02/27

LANGUNEko bazkide den HiTZ zentroak garatutako lehen bertsio hau, funtsezkoa izango da publiko handiarentzat chatbots moduko tresnak eraikitzeko.

Card image cap

Hizkuntza-eredu handi bat, edo LLM ingelesez, adimen artifizialeko eredu bat da, giza hizkuntza ulertu eta sortzeko ikaskuntza automatikoko teknikak erabiltzen dituena, datu-multzo masiboetatik sortutako ezagutzan oinarrituta. Euskarak ere badu bere hizkuntza-eredu handia: Latxa. Meta-ren LLaMA ereduetan oinarrituta dago, eta 7-70 mila miloi parametro arteko ereduak biltzen ditu. Gaur egungo LLMek errendimendu harrigarria dute baliabide ugariko hizkuntzetan, adibidez ingelesarako ChatGPT edo Bard-ek dituztenak. Euskara eta baliabide urriko beste hizkuntzen kasuan, ordea, haien errendimendua ausazko asmatzetik hurbil dago. Honek baliabide ugariko eta urriko hizkuntzen arteko arrakala teknologikoa handitu egiten du, tresna digitalei dagokionez behinik behin. LANGUNEko bazkide den UPV/EHUko Hizkuntza Teknologiako HiTZ Zentroak Latxa garatu du, muga horiek gainditzeko eta LLMetan oinarritutako euskarazko produktu, berrikuntza eta produktuen garapena sustatzeko. Lan hau Eusko Jaurlaritzak lagundu du (IKER-GAITU proiektuaren barruan).

Informazio gehiago

Albiste erlazionatuak

LANGUNEk 2025-2028ko plan estrategikoa landu du

2024/12/17

OPE Consultores aholkularitza enpresaren laguntzarekin, zuzendaritzako kideek lau saio egingo dituzte.

‘Hizkuntzen Irabazia’ kongresuak 200 lagun eta 17 hizkuntza gutxitu bildu ditu Donostian bi egunez

2024/11/27

Kongresuak agerian utzi du hizkuntzak aberastasuna direla. Ez soilik aberastasun kultural eta emozionala, baita ekonomikoa ere.

Lankidetza eta digitalizazioa hizkuntza hegemonikoei aurre egiteko

2024/11/27

‘Hizkuntzen Irabazia. Benefits of language industry in the economy’ kongresuak 200 lagun inguru bildu ditu bere lehenengo egunean.