HiTZ Zentroak euskararentzako hizkuntza eredurik handiena garatu du: Latxa

2024/02/27

LANGUNEko bazkide den HiTZ zentroak garatutako lehen bertsio hau, funtsezkoa izango da publiko handiarentzat chatbots moduko tresnak eraikitzeko.

Card image cap

Hizkuntza-eredu handi bat, edo LLM ingelesez, adimen artifizialeko eredu bat da, giza hizkuntza ulertu eta sortzeko ikaskuntza automatikoko teknikak erabiltzen dituena, datu-multzo masiboetatik sortutako ezagutzan oinarrituta. Euskarak ere badu bere hizkuntza-eredu handia: Latxa. Meta-ren LLaMA ereduetan oinarrituta dago, eta 7-70 mila miloi parametro arteko ereduak biltzen ditu. Gaur egungo LLMek errendimendu harrigarria dute baliabide ugariko hizkuntzetan, adibidez ingelesarako ChatGPT edo Bard-ek dituztenak. Euskara eta baliabide urriko beste hizkuntzen kasuan, ordea, haien errendimendua ausazko asmatzetik hurbil dago. Honek baliabide ugariko eta urriko hizkuntzen arteko arrakala teknologikoa handitu egiten du, tresna digitalei dagokionez behinik behin. LANGUNEko bazkide den UPV/EHUko Hizkuntza Teknologiako HiTZ Zentroak Latxa garatu du, muga horiek gainditzeko eta LLMetan oinarritutako euskarazko produktu, berrikuntza eta produktuen garapena sustatzeko. Lan hau Eusko Jaurlaritzak lagundu du (IKER-GAITU proiektuaren barruan).

Informazio gehiago

Albiste erlazionatuak

Mugaz gaindiko komunikazio eleanitzari buruzko uda-ikastaroa

2025/04/11

Komunikazio eleanitzari buruzko mugaz gaindiko udako ikastaroa izango da 2025eko uztailaren 2an Baionako Arteen Hirian.

Hizkuntza teknologien inpaktu handiko erabilera-kasuen azterketa aurkeztu du LANGUNEk

2025/04/08

Euskal Herriko Unibertsitateko (UPV/EHU) Hitz Hizkuntza Teknologiako Euskal Zentroak, EMUN kooperatibarekin eta Langunerekin lankidetzan hizkuntza teknologietan inpaktu handiko erabilera-kasuak identifikatzea helburu izan duen azterketa burutu du.