Ayuda de las tecnologı́as lingüı́sticas en la investigación en Humanidades Digitales

El acercamiento digital al estudio de las humanidades ofrece nuevas oportunidades para la colaboración, la reutilización de herramientas y la difusión multimodal de estos estudios. Nuevas actividades, objetos de estudio y técnicas de investigación han propiciado nuevas formas para leer, escribir, revisar, buscar, ordenar, describir y enseñar. Todo esto puede suponer un hándicap considerable en la inmersión de las Humanidades Digitales, pero el uso de las tecnologı́as lingüı́sticas y la ayuda o colaboración de las infraestructuras en humanidades como CLARIN o DARIAH, pueden ayudar a descubrir algunas ventajas y paliar de alguna forma ciertos obstáculos ya superados en proyectos anteriores. En este curso de carácter teórico-práctico los asistentes realizarán o plantearán temas de interés o de investigación basados en textos y diseñaran un pequeño corpus que podrı́a ser válidos para un estudio futuro. Después, realizarán en ese (o en otro) corpus algunas búsquedas con expresiones regulares; extraerán las palabras y sus concurrencias del corpus creado, utilizando varias herramientas de Procesamiento del Lenguaje Natural (PLN); reorganizarán algunos enunciados del fenómeno lingüı́stico que podrı́an ayudar a responder sus hipótesis con evidencias textuales (búsquedas en KWIC); observarán secuencias de palabras extrayendo n-gramas y personalizando filtros en hojas de cálculo; utilizarán las herramientas que se ofrecen en diferentes corpus (como por ejemplo Ameresco, CREA y CORPES) y, finalmente, se presentarán algunas herramientas de PLN útiles y de fácil uso (como por ejemplo ANALHITZA y Voyant Tools) con casos prácticos realizados tanto en IXA-CLARIN-K como en otros grupos de investigación, que pensamos podrı́an ser de provecho tanto para docentes, bibliotecarios/as e investigadores en Humanidades y Ciencias Sociales Para terminar la sesión se hará un análisis de las necesidades que podrı́an tener los asistentes, para estudiar tipos de colaboración dentro de la infraestructura lingüı́stica de IXA-CLARIN-K y las interesadas y los interesados.
Authors: 
Arantza Diaz de Ilarraza, Mikel Iruskieta
Year: 
2019
Publication place: 
XVI Simposio Internacional de Comunicacion Social (XVI-SICS)