AAAIFeb, 2024

CFEVER:一个中文事实抽取和验证数据集

TL;DRCFEVER 是一个中文数据集,用于事实提取和验证,利用中文维基百科的内容手动创建了 30,012 个声明,并标记为 “支持”、“反驳” 或 “信息不足”,同时提供详细的证据句子。这个数据集通过 Fleiss' kappa 值(0.7934)的五向评判员一致性达到了新的高度,通过与现有方法和基准测试的实验表明,CFEVER 是一个严格的事实提取和验证基准,可用于开发自动化系统减少人工事实核查工作量。