DoQA

Deskribapen laburra: 
Ingelesezko elkarrizketa bidezko galdera-erantzunen datu-multzoa
Egileak (ixakideak ez direnak): 
Jan Deriu, Mark Cieliebak
Esteka (beste batzuk): 

To download older versions:
http://ixa2.si.ehu.es/convai/doqa-v1.0.zip

Harremanetarako: 
Jon Ander Campos jonander.campos[abildua/at]ehu.eus
Deskribapena: 

DoQA elkarrizketa bidezko galdera-erantzunek osatzen duten datu-multzoa da. Domeinu espezifikoetako FAQ webguneak (Frequently Asked Questions edo maiz egiten diren galderak) edo foroak atzitzeko balio duten 2.437 elkarrizketa ditu (10.917 galdera/erantzun pare guztira), 3 domeinu ezberdinetakoak: sukaldaritza, bidaiak eta filmak.

Elkarrizketa hauek crowd workder deritzenek sortu dituzte, binaka rol hauek hartuz: erabiltzaileak Stack Exchange foroan (https://stackexchange.com/) idatzitako gai jakin bati buruzko galderak egiten ditu, eta adituak galderei erantzuten die jatorrizko artikuluko testutik zati labur bat hautatuz. Hautatutako testu-zatia berridatzi dezake adituak, naturalagoa izan dadin. Datu-multzoan erantzunik gabeko galdera batzuk ere badaude.

Tresna hau erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
J.A. Campos, A. Otegi, A. Soroa, J. Deriu, M. Cieliebak, E. Agirre. DoQA - Accessing Domain-Specific FAQs via Conversational QA. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020

Jabetza: 
Copyright (C) by Ixa Taldea, University of the Basque Country UPV/EHU
Lizentzia: 
Creative Commons Attribution-ShareAlike 4.0 International Public License (CC BY-SA 4.0)