Nov, 2022

CREPE:带有错误前提的开放领域问答

TL;DR介绍了一个包含在线信息获取论坛上的自然分布条件失败的问答数据集 CREPE,其中 25%的问题包含虚假前提;通过实验表明现有的开放域问答模型可以适当地找到前提,但很难预测前提是否属实,CREPE 提供了研究野外问答的基准,并为更好地建模和深入研究任务提供了途径。