科学事实核查:资源和方法综述
本文综述了基于自然语言处理的自动事实核查技术及其在相关学科里的应用。该技术使用自然语言处理、机器学习、知识表示和数据库等技术预测声称的可信度,同时介绍了现有数据集和模型,旨在统一各种定义并识别通用概念,最后提出了未来研究的挑战。
Aug, 2021
该篇论文回顾了涉及自动事实检查的相关研究,包括索取检测和索求验证组件,并探讨了自然语言处理,自动化事实检查的数据集以及提出的各种 NLP 方法在该领域发展方面所做的贡献。
Sep, 2021
该研究是针对需要特定专业知识的领域的事实核查的第一项探索性研究,提出了可解释的事实核查模型,并针对公共卫生领域构建了一个新的数据集进行案例研究,结果表明,通过对特定领域的数据进行训练,可以提高自动化事实核查的可解释性。
Oct, 2020
本研究主要讨论了解决当前网络上 “假新闻” 和政客言论真实性验证的问题,提出了一种基于学习排序模型的检索算法,并建立了一个相关数据集,实验结果表明该方法优于现有的基于检索和文本相似度的算法。
May, 2020
本文介绍了一个用于事实核查的自动化平台,该平台能够检索相关文本证据,预测每个证据是否支持或反驳一个声明,并返回最终结论。此外,本文还对这个平台在新闻工作流中的应用进行了用户研究,并为其性能作出了评估。结果表明,该平台的预测正确率为 58%,返回的证据中有 59%是相关的。
Apr, 2019
该研究综述了当前 NLP 技术在事实核查方面的能力和局限性,并强调将人性化设计方法融入模型开发,早期与事实核查利益相关者合作以及开展支持人性化事实核查技术的基准开发的必要性。
Jan, 2023
科学的论断验证是一个新的任务,其目的是从研究文献中选择包含支持或驳斥给定科学论断的摘要,并确定证据。为了研究这个任务,我们构建了 SciFact 数据集,其中包括 1.4K 个专家撰写的科学论断,以及用标签和论据注释的含有证据的摘要。我们开发了 SciFact 的基线模型,并证明简单的领域适应技术可以大大提高性能,并能够使用 CORD-19 语料库鉴定与 COVID-19 相关的声明。我们的实验表明,SciFact 将为设计用于检索和推理包含专业领域知识的语料库的新系统提供具有挑战性的测试平台。
Apr, 2020
本文介绍自动事实核查在互联网内容管理中的重要性,提出了面向缺陷的事实核查任务并引入了专门设计的框架 RefuteClaim,通过提取和转换专家审查的见解,创造了用于该任务的数据集 FlawCheck,并实验证明了 RefuteClaim 在分类和阐明虚假主张方面的有效性。
Jan, 2024