Itzulpengintza Automatikoa

Leveraging SNOMED CT terms and relations for machine translation of clinical texts from Basque to Spanish

We present a method for machine translation of clinical texts without using bilingual clinical texts, leveraging the rich terminology and structure of the Systematized Nomenclature of Medicine – Clinical Terms (SNOMED CT), which is considered the most comprehensive, multilingual clinical health care terminology collection in the world. We evaluate our method for Basque to Spanish translation, comparing the performance with and without using clinical domain resources.

Neural Machine Translation of clinical texts between long distance languages

ABSTRACT Objective: To analyze techniques for machine translation of electronic health records (EHRs) between long distance languages, using Basque and Spanish as a reference. We studied distinct configurations of neural machine translation systems and used different methods to overcome the lack of a bilingual corpus of clinical texts or health records in Basque and Spanish.

Adapting NMT to caption translation in Wikimedia Commons for low-resource languages

This paper presents a successful domain adaptation of a general neural machine translation (NMT) system using a bilingual corpus created with captions for images in Wiki- media Commons for the Spanish-Basque and English-Irish pairs. Keywords: Machine Translation, Low-resource languages, Bilingual corpora, Language resources from Wikipedia

DOMINO: Traducción Automática Neuronal, en DOMInio, NO supervisada.

2018an kalitatezko itzulpen automatikoa (IA) hizkuntza-pare gehienentzat erronka izaten jarraitzen zuen, baina azken urteotan alor honen garapena errealitate bihurtu da. Ikasketa sakona erabiliz (Deep Learning), embedding-en ekarpen argiarekin eta neurona-tekniken bidez, duela hiru urte pentsaezinak ziruditen emaitzak lortu ditu Itzulpen Automatiko neuronalak (NMT).

MODENA: Modelado neuronal avanzado para traducción de alta calidad.

MODENA proiektuaren helburu nagusia kalitate handiko itzulpen automatikoko sistemak ikertu, garatu eta balidatzea da, ikaskuntza sakonean eta neurona-sare artifizialetan oinarritutako arkitektura eta prozesuen bitartez. Helburu orokor hori honako helburu zientifiko-teknologikoetan banatzen da:
(1) Informazioa mantenduz Itzulpen-kalitatea nabarmen hobetuko dituzten neurona-itzulpeneko arkitekturak eta algoritmoak ikertu eta garatzea.
(2) Datuak modelatu eta ustiatzeko metodoak ikertzea eta garatzea.

UnsupNMT: Traducción Automática Neuronal no Supervisada: un nuevo paradigma basado solo en textos monolingües.

Itzulpen automatikoa teknologia heldua da eta pisu ekonomiko handia du, baina oraindik ere hobekuntza marjina handia du testu elebidun gutxi daudenean. Proiektu honek itzulpen automatikoa egiteko metodo guztiz berria proposatzen du: gainbegiratu gabeko itzulpena. Hau da, testu elebakarretan soilik oinarritua, baliabide elebidunik gabe. Metodoa hizkuntzen arteko hitz-errepresentazioak (cross-lingual word embeddings) eta sekuentzien ikaskuntza sakona erabiltzen ditu.


