Workshop LINGUATEC : Ressources et outils pour le traitement automatique des langues des Pyrénées

12 mai 2021 - En ligne, avec présentations en anglais, espagnol et français, avec traduction simultanée en anglais, espagnol et français.

10h – Ouverture

10h15 Conférences invitées: traitement automatique du catalan

    Lluis Padró (Universitat Politècnica de Catalunya)
    Morphological and Syntactic Resources in FreeLing
    Ressources syntaxiques et morphologiques sous FreeLing
    Présentation en anglais - traduction simultanée en espagnol et français

    Mariona Taulé (Universitat de Barcelona)
    AnCora: un corpus anotado a diferentes niveles lingüístico
    AnCora: un corpus marqué à différents niveaux linguistiques
    Présentation en espagnol - traduction simultanée en anglais et français

11h15 -- Pause

11h30 Présentations : corpus annotés pour l’occitan et le basque et autres langues peu dotées

    Assaf Urieli, Joliciel
    Talismane, Jochre: automatic syntax analysis and OCR for under-resourced languages
    Talismane, Jochre : outils pour l'analyse syntaxique automatique et l'océrisation des langues peu dotées
    Présentation en anglais - traduction simultanée en espagnol et français

    Aleksandra Miletic y Dejan Stosic, CLLE
    Mutualisation des ressources pour la création de treebanks : le cas du serbe et de l'occitan
    Présentation en français

    Ainara Estarrona (IXA, HiTZ, UPV/EHU)
    Construcción del corpus histórico en euskera
    Construction du corpus historique en basque
    Présentation en espagnol - traduction simultanée en anglais et français

13h -- Pause

14h30 Conférence invitée: Réseaux neuronaux

    Mans Hulden (University of Colorado)
    Neural Networks in Linguistic Research
    Présentation en anglais - traduction simultanée en espagnol et français

15h30 Présentation

    Rodrigo Agerri (IXA, HITZ, UPV/EHU)
    Contextual lemmatization for inflected languages: statistical and deep-learning approaches
    Présentation en anglais - traduction simultanée en espagnol et français

16h - Pause

16h15 - Présentations : Résultats du projet LINGUATEC

    Myriam Bras, Aleksandra Miletic, Marianne Vergez-Couret, Clamença Poujade, Jean Sibille, Louise Esher, CLLE :
    Traitement automatique de l’occitan : construction des premiers corpus annotés
    Vidéo en occitan avec sous-titres accessibles dans les autres langues.

    Elhuyar
    Creación y mejora de los recursos del euskera en el marco de Linguatec
    Création et amélioration des ressources basques dans le cadre de Linguatec
    Vidéo en basque avec sous-titres accessibles dans les autres langues.

16h45 - Conclusions
   Présentation en français et espagnol

17h - Clôture