- AAAI2022 年 Factify 比赛中的 GPTs:基于提示的事实验证
对抗虚假新闻,提出了基于 PLM 和 Prompt-based learning 的两种方法,均采用文本数据,结果表明该方法比仅微调 PLMs 更优。
- 超越事实验证:比较争议话题上的不同主张
本研究提出了一种名为 ClaimDiff 的新的数据集,用于比较包含微妙差别的主张对之间的区别,并帮助人们在各种媒体来源中做出更明智的决策。
- ACL基于段落的 Transformer 预训练模型用于多句推理
本文介绍了一种新的预训练目标,用于在多个输入句子之间建模段落级别的语义,并证明了该预训练技术在多候选推理任务的联合建模和交叉编码器场景下优于传统技术。
- SIGIRGERE: 用于事实验证的生成式证据检索
该论文提出了 GERE,一个通过生成方式检索证据的系统,以解决事实验证中的技术难题,即减少存储和计算成本,捕捉文档和句子之间的依赖关系,动态地选择每个索赔的相关证据,超越现有技术基线。
- EMNLP基于表格的事实验证探索分解
本文提出了一种分解复杂语句为简单子问题,并以程序为指导构建伪数据集进行分解模型训练的方法,从而增强事实验证模型的中间证据,通过实验证明,在 TabFact 基准测试中取得了 82.7%的最新最佳性能。
- EMNLP基于表格的事实验证与关注度感知学习
本文提出一种新颖的系统,利用因果关系理论,通过探测式显著性估算方法确定语句的令牌级显著性,从而尝试在文本语句与表格数据之间建立联系和推理,进而应用显著性感知的数据增强技术来生成更多样化的训练实例,并结合该技术在 TabFact 数据集上取得 - ACLProoFVer: 用于事实验证的自然逻辑定理证明系统
该论文提出 ProoFVer,使用 seq2seq 模型生成自然逻辑推理作为证明,以此决定索赔真实性,它拥有最高的标签准确性和第二优秀的 FEVER 排行榜得分,证明了它的鲁棒性。
- FEVEROUS: 面向结构化和非结构化信息的事实提取与验证
本文提出了针对机器学习和自然语言处理领域中问题验证的一个新数据集和一个基线模型,数据集包含了包括非结构化文本和结构化表格在内的 87026 个证明,并详细描述了数据集中存在的偏见及模型的防范措施。
- ACL面向题目感知的证据推理和立场感知的聚合用于事实核查
该研究提出了一种主题感知证据推理和立场感知集成模型来更准确地验证事实,重点在于检查索赔和证据之间的主题一致性,维护多个证据之间的主题连贯性,确保全局主题信息和证据的语义表示之间的语义相似性,并基于证据对索赔的隐含立场聚合证据。
- 基于证据的事实错误校正
本文介绍了事实错误校正的任务和方法:通过编辑要求以便生成的改写通过证据更好地支持。使用 T5 Transformer 基于远程监督的方法,通过将证据合并到掩码声明中来训练事实错误校正系统。在一个基于最近事实验证共享任务的数据集上进行评估,结 - SemEval-2021 任务 9:科学文档中表格数据的事实验证和证据搜索(SEM-TAB-FACTS)
本研究旨在解决在科技论文中理解表格结构与表格内容,主要通过提供一个包含这些信息的数据集和 SemEval 任务挑战赛中两个子任务的方式来实现,共有 69 个团队参与,19 个成功提交了子任务 A 的结果,12 个成功提交了子任务 B 的结果 - ACL获得你的维生素 C!对比证据的强大事实验证
使用维基百科修订记录的更新、实现语言和内容几乎相同但是支持或不支持某一主张的例子、为核实声明时打上相关字标,标识事实修订并且通过事实上的一致文本生成提供自动编辑,从而增强模型的鲁棒性:对敌对事实验证提高了 10%,对敌对自然语言推理提高了 - WSDM解释、预测,再次预测
本文介绍了一种名为 ExPred 的新方法,采用多任务学习的方法,在任务输入的解释生成阶段有效地平衡了解释和预测的损失,并使用另一个预测网络来优化任务性能。在三个不同的语言数据集上进行了广泛的评估,发现我们明显优于现有方法。
- ACL基于证据的事实错误修正
本文介绍了一个新的任务:事实错误纠正。通过将证据整合到掩码声明中进行更正,学习纠正事实错误的系统。本文中提出了一个基于 T5 变压器的两阶段远程监督方法,通过检索证据获得更好的结果,从而取得了更好的性能,并通过人类评估证明了其有效性。
- AAAILOREN: 基于逻辑规范化的可解释事实验证推理
文章提出了一种基于 LOREN 的 Fact Verification 方法,将整个主张的验证分解成短语级别,以短语真实性作为解释,并根据逻辑规则汇总到最终的裁决中。LOREN 的关键在于将 claim 短语真实性表示为三值潜变量。实验结果 - EMNLPHoVer:用于多跳事实提取和声明验证的数据集
介绍了 HoVer 数据集,用于测试模型在从多篇维基百科文章中提取证据并分类核实主张上的表现,展示了许多跳推理的必要性和现有语义匹配模型在推理跳数增加时性能下降的现象。
- EMNLP通过语言化和图注意网络强化事实验证程序
本研究提出了 ProgVGAT 框架,结合程序和执行到文本推理模型,通过程序执行的表现和结构、原文陈述和表格等不同证据,来实现基于结构化数据的事实验证,并通过使用基于距离的新训练策略来优化 ProgVGAT 中的程序选择模块,从而提供更精确 - ACL核图注意力 Fine-grained 事实验证
本研究提出基于核的图注意力网络 (KGAT),利用节点核函数和边缘核函数,在证据图中进行更细粒度的证实验证,相比于点积注意力,核心注意力更能集中于相关证据句子和证据图中的有意义的线索,从而在 FEVER 测试数据集上取得了较高的 70.38 - EMNLP揭示语义检索对大规模机器阅读的重要性
本文提出管道系统及语义检索中间层制定通用设计指南。在事实检查和开放领域多跳 QA 中,该系统取得了表现。统计分析表明,中间层语义检索提高了上游信息的筛选效率,下游建模的数据质量,实现了学习上下文逻辑结构的机器阅读。
- ICLRTabFact:一个用于基于表格的事实验证的大规模数据集
本文介绍 TabFact 数据集,其中包含 118k 人工标注的自然语言陈述,并以 16k 个 Wikipedia 表格作为证据,同时介绍了 Table-BERT 和 LPA,这两种算法都能在半结构化数据情况下进行事实验证,都有优点和不足之