EMNLPNov, 2018

事实提取和验证(FEVER)共享任务

TL;DR本文介绍了首个事实提取和验证(FEVER)共享任务的结果,该任务要求参与者使用从 Wikipedia 检索到的证据来判断是否可以支持或反驳人工编写的事实性声明。我们收到了来自 23 个竞争团队的条目,其中 19 个得分高于以前发布的基线。最佳表现系统的 FEVER 得分达到 64.21%。