Mar, 2023

WiCE:维基百科索赔的真实世界蕴含关系

TL;DR提出了 WiCE 文本蕴涵数据集,该数据集围绕在文本中验证声明,建立在维基百科的现实声明和证据基础之上,并通过 GPT-3 将假设分解成子句单元,每个单元都与源文档中的证据句子的一个子集标记。通过这个数据集,我们展示了真实声明涉及具有挑战性的验证问题,并对这个数据集上现有方法进行了基准测试。此外,我们表明,通过 GPT-3 分解声明可以在各个领域上提高蕴含模型的性能。