Testuen analisia

Hizkuntza-teknologiak sustatzeko proiektu transbertsalak

Administrazio Publikoan zein sektore pribatuan lehentasunezkoa da berrikuntza, hau da, teknologia gaurkotuak aplikatzeko proiektuak bultzatzea. Planteamendu estrategikoetatik abiatuta, proiektu zehatzak behar dituzte enpresa pribatuek nahiz administrazio publikoak. Izan ere, proiektu egingarrien bitartez egiaztatu ahal izango da zer onura dakartzaten aurrerakuntza teknologikoek edozein arlotan.

Learning about phraseology from corpora: A linguistically motivated approach for Multiword Expression identification.

Multiword Expressions (MWEs) are idiosyncratic combinations of words which pose important challenges to Natural Language Processing. Some kinds of MWEs, such as verbal ones, are particularly hard to identify in corpora, due to their high degree of morphosyntactic flexibility. This paper describes a linguistically motivated method to gather detailed information about verb+noun MWEs (VNMWEs) from corpora. Although the main focus of this study is Spanish, the method is easily adaptable to other languages.

DeepText

DeepText proiektuan Euskal Herrian dagoen hizkuntzaren teknologiari lotutako industria sustatu nahi da, eta, horretarako, adimen artifizialeko azken teknikak erabiltzen dituzten hizkuntza eredu neuronalak jorratuko dira bertan. Zehazki, proiektuak euskara zein gaztelerarako hizkuntza ereduak sortuko ditu, hizkuntzaren prozesamendurako oinarrizko baliabideak izango direnak.

Distância diacrónica automática entre variantes diatópicas do português e do espanhol

O objetivo deste trabalho é aplicar uma metodo- logia baseada na perplexidade, para calcular automa- ticamente a distância interlinguística entre diferentes períodos históricos de variantes diatópicas de idiomas.

Orriak

RSS - Testuen analisia-rako harpidetza egin