ACLJun, 2020

ClarQ:一个大规模且多样化的澄清问题生成数据集

TL;DR通过基于自监督的新型启动框架,从 stackexchange 中提取 post-comment 元组,利用神经网络分类器构建了一个多样化、大规模的澄清问题数据集。将该数据集应用于问题回答的下游任务的实验表明其效用,并放出名为 ClarQ 的含 173 个领域的 2M 个实例的数据集。其目的是促进澄清问题生成的研究,以提升对话和问题回答系统。