DeepR3: Reducing, Reusing and Recycling large models for developing Responsible and Green Language Technologies

Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (eu): 
DeepR3 (TED2021-130295B-C31) founded by MCIN/AEI/10.13039/501100011033 and European Union NextGeneration EU/PRTR
DeepR3 proiektuan metodo eraginkor berriak ikertuko dira jadanik esistitzen diren hizkuntza-ereduak berrerabili eta egokitzeko, erabilera desberdinetako kasuetan aplikatzeko helburuarekin, hala nola, domeinu biomedikoan, itzulpen automatikoan edo datu meteorologikoetatik sortutako testuetan. Proiektuan gaztelania, katalana, euskara, galegoa eta ingelesa landuko dira. DeepR3 proiektuaren emaitzek eragin zuzena izango dute trantsizio ekologikoan zein digitalean, bere helburu nagusienetako bat gehiegizko energia-xahutzea saihestea baita, NLPko zeregin anitzetan aplika daitezkeen hizkuntza-ereduak elebakar eta eleanitz sortzean. To acknowledge the project in the papers, put the following: DeepR3 (TED2021-130295B-C31) founded by MCIN/AEI/10.13039/501100011033 and European Union NextGeneration EU/PRTR.
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (en): 
DeepR3 (TED2021-130295B-C31) founded by MCIN/AEI/10.13039/501100011033 and European Union NextGeneration EU/PRTR.
Deskribapena (en): 
DeepR3 will investigate new efficient methods to extend, reuse and adapt existing pre-trained language models for Spanish, Catalan, Basque, Galician plus English to be exploited in new domains, genres and languages for being applied to different use cases such as the biomedical domain, machine translation or text generation from meteorological data. The results of DeepR3 will have a direct impact on both the Ecological Transition by avoiding unnecessary waste of energy and the Digital Transition by creating better language models for more languages that can be applied to multiple NLP tasks. Argitalpenetan honako hau jarri: DeepR3 (TED2021-130295B-C31) founded by MCIN/AEI/10.13039/501100011033 and European Union NextGeneration EU/PRTR.
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (es): 
DeepR3 (TED2021-130295B-C31) financiado por MCIN/AEI/10.13039/501100011033 y por la Unión Europea NextGeneration EU/PRTR.
Deskribapena (es): 
DeepR3 investigará nuevos métodos eficientes para extender, reutilizar y adaptar los modelos lingüísticos previamente entrenados para español, catalán, euskera, gallego e inglés para explotarlos en nuevos dominios, géneros e idiomas para aplicarlos a diferentes casos de uso, como el dominio biomédico, la traducción automática o generación de texto a partir de datos meteorológicos. Los resultados de DeepR3 tendrán un impacto directo tanto en la transición ecológica, al evitar el gasto innecesario de energía, así como en la transición digital al crear mejores modelos de lenguaje para más idiomas que se pueden aplicar a múltiples tareas de PLN. To acknowledge the project in the papers, put the following (ES): DeepR3 (TED2021-130295B-C31) financiado por MCIN/AEI/10.13039/501100011033 y por la Unión Europea NextGeneration EU/PRTR.
Kode ofiziala: 
TED2021-130295B-C31
Ikertzaile nagusia: 
Aitor Soroa, German Rigau
Erakundea: 
Ministerio de Ciencia e Innovación
Hasiera data: 
2022/12/01
Bukaera data: 
2024/11/30
Taldeko ikertzaile nagusia: 
German Rigau
Aitor Soroa
Kontratua: 
Ez