Hizkuntza baliabideak

DeepMinor: Language Models for Multilingual and Multidomain Text Processing in Low Resource Scenarios

Hizkuntza eredu handien aurrerapenei esker, Hizkuntzaren Prozesamendua (HP) ikerketa-eremua hizkuntza eredu handi horien ekoizpen eta ustiapenera bideratutako paradigma aldaketa batean murgilduta dago. Izan ere, emaitzak hainbeste hobetzen ari dira, non sistemek giza-mailako errendimendua aldarrikatzen dute ikerketa-erreferenteetan. Ondorioz, industrian asko hasi dira ekoizpenean integratzen. Emaitza ikusgarriak izan arren, hizkuntza eredu hauek ingeleserako garatu dira batez ere, ez dira publikoak eta

Scaling language models for low-resource languages

Hizkuntza- eredu handiak (HE) Adimen Artifizialaren egungo iraultzaren oinarrian daude, eta Hizkuntza Naturalaren Prozesamenduan aurrerapen izugarriak lortzeko oinarriak ezarri dituzte. HEak eraikitzeko baliabide handiak behar dira, bai konputazioari dagokionez, eta baita datuei dagokienez ere. Horrela, gaur egun soilik enpresa pribatu gutxi batzuk dira gai HEak aentrenatzeko. Ondorioz, HEak baliabide handiko hizkuntzetan eraiki ohi dira dira, ingelesa kasu, baina beste hizkuntza askok, batez ere baliabide urriak badituzte, oso atzean geratzeko arriskua dute.

Linguistically annotated multilingual comparable corpora of parliamentary debates in English ParlaMint-en. ana 4.0

ParlaMint-en.ana 4.0 is the English machine translation of the ParlaMint.ana 4.0 (http://hdl.handle.net/11356/1860) set of corpora of parliamentary debates across Europe. The translation is linguistically annotated similarly to the original language corpora (but without UD syntax), and with the addition of USAS semantic tags (https://ucrel.lancs.ac.uk/usas/). Because of the addition of semantic tags the UK corpus (ParlaMint-GB) is also included.

Orriak

RSS - Hizkuntza baliabideak-rako harpidetza egin