Discourse

Benchmarking Critical Questions Generation: A Challenging Reasoning Task for Large Language Models

The task of Critical Questions Generation (CQs-Gen) aims to foster critical thinking by enabling systems to generate questions that expose underlying assumptions and challenge the validity of argumentative reasoning structures. Despite growing interest in this area, progress has been hindered by the lack of suitable datasets and automatic evaluation standards. This paper presents a comprehensive approach to support the development and benchmarking of systems for this task. We construct the first large-scale dataset including ~5K manually annotated questions.

Laburpenaren ebaluaziorako proposamena LHn eta unibertsitatean

Ikasleek ikasketa-maila bakoitzean izan beharreko laburpen-gaitasuna ondo zehaztuta izatea oso garrantzitsua da irakasleak ikasleak ulertu duena sakontasunez jakiteko eta feedback egokia emateko; tamalez, beharrizan horri ez zaio behar bezala erantzuten. Horri buelta emateko, laburpenak lantzeko proposamenak egiteaz gain, nahitaezkoa da proposamen horiekin ikasleek nola jardun duten ondo aztertzea eta emaitzak biltzea, horrek emango baitigu ikasleek ikasketa-maila bakoitzean laburpenak biltzen dituen trebetasunetan izan beharreko maila zehazteko bidea.

Pages

Subscribe to RSS - Discourse