HARTAvas: Estudio de las combinaciones léxicas vascas en un corpus académico de noveles para una Herramienta de Ayuda a la Redacción de Textos Académicos

Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (eu): 
Euskarazko konbinazio lexikoak aztertuko dira ikasleen corpus akademiko batean testu akademikoen idazketan laguntzeko tresna bat (HARTA) garatzeari begira.
Euskal Herriko Unibertsitate publikoko ikasleen erdiak baino gehiagok euskara aukeratzen dute ikaskuntza-irakaskuntzarako hizkuntza behikular modura, eta komunikazio akademikoaren bereizgarriak diren testu-generoak ulertzeko eta ekoizteko erronkari aurre egin behar diote. Horretarako, testu-genero horietan modu errekurrentean erabiltzen diren konbinazio lexiko akademikoen (KLA) erabileran trebatu behar dira: kolokazioak, diskurtso-markatzaileak eta beste diskurtso-formula batzuk. Azken aldian testuinguru akademikoetan nagusi diren ingelesa bezalako hizkuntzetarako idazkuntzan laguntzeko tresna ugari garatu izanak agerian uzten ditu ikasleei KLAk menderatzeak dakarzkien zailtasunak, baita haien prestakuntzan erabiltzen diren testuetan maiz erabiliak direnean ere. Gure abiapuntuko hipotesia da euskarazko KLAk ikastea are zailagoa dela euskararen egoera soziolinguistikoarekin zerikusia duten hainbat arrazoirengatik: a) KLA ugari oraindik ez daude finkatuta eta aldakortasun maila handiagoa erakusten dute ondo ezarritako hizkuntzetan baino. b) Ikuspegi sintaktiko edo semantikotik erabat egokiak ez diren zenbai hitz-konbinazio errekurrente bihurtzen dira eta, horrela, testuetan duten presentzia nabariki areagotzen da. Nolanahi ere, nahitaezkoa da egiaztatzea balizko zailtasun horiek corpusetan. Horretarako, ikasleen euskarazko corpus bat bildu, eta ikasleen espainolezko HARTA corpusarekin alderatuko da. Helburua da espainiera-euskara konbinazio elebidunak erauzteko aukerak probatzea semantika distribuzionaleko teknikak corpus konparagarrietan aplikatuz. Horrela, adituen espainoleko corpusetik abiatuta HARTA tresnan KLAei diskurtso-funtzioak esleitzeko lana aprobetxatu ahal izango da. Azpiproiektu honen helburu orokorra da lan akademikoak euskaraz idazten dituzten ikasleek egiten duten KLEen erabilera aztertzea eta espainola erabiltzen duten ikasleenarekin alderatzea. Helburu aplikatua da euskarazko eta gaztelaniazko lexikoa eta corpusa integratzen dituen idazketa akademikoari laguntzeko tresna bat diseinatzea. Tresna horrek ikasleei lagunduko lieke idazketa akademikorako trebetasunak garatzen eta, gainera, ekarpen bat egingo lioke euskararen erregistro akademikoen garapenari.
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (en): 
Study of lexical combinations in Basque based on a novice academic corpus for an Academic Texts Writing Aid
Deskribapena (en): 
More than half of the students of the Basque public university use Basque as a vehicular language, and face the challenge of understanding and producing the textual genres characteristic of academic communication. In order to achieve this challenge, they need to become acquainted with the recurrent academic lexical combinations (ALC) of these genres: colocations, discourse markers and other discursive formulas. Several academic writing assistance tools have been developed for languages of major use in the academic environment such as English. This proliferation demonstrates the difficulty for students of acquiring the ALC, although they are used repeatedly in the texts used in higher education. Our starting hypothesis is that the acquisition of ALCs in Basque is even more difficult due to several reasons related to the sociolinguistic status of the language: a) Many ALCs have not been established yet and have a greater degree of variation than in well-established languages. b) Some combinations of words that are not correct from the semantic or syntactic point of view become recurrent and rapidly multiply their presence in the texts. However, it is necessary to study the real extent of the hypothetical difficulties in corpora. With this aim in mind, we will compile a Basque corpus of novice writers and compare it with the HARTA corpus of Spanish novice writers. We want to test the possibility of extracting Spanish-Basque bilingual combinations using distributional semantics techniques on comparable corpora. In this way, we can take advantage of the work of assigning discursive functions to the ALC established in HARTA from the corpus of experts in Spanish. The overall goal of this subproject is to investigate the use of ALCs by the students that use Basque in academic writing and compare it with that of students using Spanish. Our applied aim is to design an academic writing assistance tool in both Basque and Spanish, which integrates both lexicon and corpus. This tool would help students developing their skills for academic writing and, in addition, it would contribute to the normalization of Basque academic registers.
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (es): 
Se estudiarán las combinaciones léxicas en un corpus académico de noveles en euskera con el fin de diseñar una herramienta de ayuda a la redacción de textos académicos (HARTA).
Deskribapena (es): 
Más de la mitad de los estudiantes de la universidad pública vasca utilizan el vasco como lengua vehicular, y se enfrentan al reto de comprender y producir los géneros textuales característicos de la comunicación académica. Para ello, necesitan familiarizarse con las combinaciones léxicas académicas recurrentes de dichos géneros (CLA): colocaciones, marcadores discursivos y otras fórmulas discursivas. La proliferación de herramientas de ayuda para la redacción en lenguas de uso preponderante en el entorno académico como el inglés, evidencia la dificultad que para los estudiantes entraña la adquisición de las CLA, a pesar de que sean usadas de forma recurrente en los textos utilizados en su formación. Nuestra hipótesis de partida es que la adquisición de las CLA en vasco es aún más dificultosa debido a varias razones relacionadas con el estatus sociolingüístico de la lengua: a) Muchas CLA no se han fijado aún y presentan mayor grado de variación que en lenguas bien establecidas. b) Algunas combinaciones de palabras que no son correctas desde el punto de vista semántico o sintáctico se convierten en recurrentes y multiplican rápidamente su presencia en los textos. Sin embargo, es necesario estudiar el alcance real de las hipotéticas dificultades en corpus. Para ello, compilaremos un corpus vasco de noveles y lo compararemos con el corpus HARTA de noveles en español. Queremos testar la posibilidad de extraer combinaciones bilingües español-vasco aplicando técnicas de semántica distribucional en corpus comparables. De este modo, podremos aprovechar el trabajo de asignación de funciones discursivas a las CLA establecidas en HARTA a partir del corpus de expertos en español. El objetivo global de este subproyecto es investigar el uso de las CLA por parte de los estudiantes que utilizan el vasco en sus trabajos académicos y compararlo con el de los estudiantes que utilizan el español. El fin aplicado es el diseño de una herramienta de ayuda a la escritura académica tanto en vasco como en español que integre tanto léxico como corpus. Esta herramienta ayudaría a los estudiantes a desarrollar sus destrezas para la escritura académica y, además, contribuiría a la normalización de los registros académicos del vasco.
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (fr): 
Les combinaisons lexicales seront étudiées dans un corpus académique de débutantes en basque afin de concevoir un outil d'aide à la rédaction de textes académiques (HARTA).
Deskribapena_fr: 
Plus de la moitié des étudiants de l'université publique basque utilisent le basque comme langue véhiculaire et sont confrontés au défi de comprendre et de produire les genres textuels caractéristiques de la communication académique. Pour ce faire, ils doivent se familiariser avec les combinaisons lexicales académiques récurrentes de ces genres (CLA): colocations, marqueurs discursifs et autres formules discursives. La prolifération d'outils d'aide à la rédaction en langues d'usage prépondérant dans l'environnement académique comme l'anglais, met en évidence la difficulté qu'entraîne pour les étudiants l'acquisition des CLA, même si elles sont utilisées de façon récurrente dans les textes utilisés dans leur formation. Notre hypothèse de départ est que l'acquisition des CLA en basque est encore plus difficile en raison de plusieurs raisons liées au statut sociolinguistique de la langue: a) Beaucoup de CLA n'ont pas encore été fixées et présentent un degré plus élevé de variation que dans des langues bien établies. b) Certaines combinaisons de mots qui ne sont pas correctes du point de vue sémantique ou syntaxique deviennent récurrentes et multiplient rapidement leur présence dans les textes. Cependant, il est nécessaire d'étudier la portée réelle des difficultés hypothétiques dans le corpus.Pour cela, nous compilerons un corpus basque de nouveaux et le comparerons avec le corpus HARTA de débutantes en espagnol. Nous voulons tester la possibilité d'extraire des combinaisons bilingues espagnol-basque en appliquant des techniques de sémantique distributionnelle en corpus comparables. Ainsi, nous pourrons profiter du travail d'attribution des fonctions discursives aux CLA établies dans HARTA à partir du corpus d'experts en espagnol. L'objectif global de ce sous-projet est d'étudier l'utilisation des CLA par les étudiants qui utilisent le basque dans leurs travaux académiques et de le comparer avec celui des étudiants qui utilisent l'espagnol. Le but appliqué est la conception d'un outil d'aide à l'écriture académique aussi bien en basque qu'en espagnol qui intègre à la fois lexique et corpus. Cet outil aiderait les étudiants à développer leurs compétences pour l'écriture académique et, en outre, contribuerait à la normalisation des registres académiques du basque.
Kode ofiziala: 
PID2019-109683GB-C22
Ikertzaile nagusia: 
Miren Igone Zabala Unzalu
Erakundea: 
Ministerio de Ciencia Innovación y Universidades
Saila: 
Euskal Hizkuntza eta Komunikazioa
Hasiera data: 
2020/06/01
Bukaera data: 
2023/12/31
Taldea: 
Ixa Taldea
Taldeko ikertzaile nagusia: 
Igone Zabala
Partaideak (Ixakideak hemen sartuta ere banan banan aukeratu behar dira Ixakide atalean): 
Maxux Aranzabe, Nerea Ezeiza, Josu Goikoetxea, Uxoa Iñurrieta, Igone Zabala
Besteak: 
Antton Gurrutxaga (Elhuyar)
Kontratua: 
No
HiTZen ez bistaratu