实时从新闻文章中检测索取含义相似的事实核查
本文综述了基于自然语言处理的自动事实核查技术及其在相关学科里的应用。该技术使用自然语言处理、机器学习、知识表示和数据库等技术预测声称的可信度,同时介绍了现有数据集和模型,旨在统一各种定义并识别通用概念,最后提出了未来研究的挑战。
Aug, 2021
该篇论文回顾了涉及自动事实检查的相关研究,包括索取检测和索求验证组件,并探讨了自然语言处理,自动化事实检查的数据集以及提出的各种 NLP 方法在该领域发展方面所做的贡献。
Sep, 2021
本文介绍了一个用于事实核查的自动化平台,该平台能够检索相关文本证据,预测每个证据是否支持或反驳一个声明,并返回最终结论。此外,本文还对这个平台在新闻工作流中的应用进行了用户研究,并为其性能作出了评估。结果表明,该平台的预测正确率为 58%,返回的证据中有 59%是相关的。
Apr, 2019
本文探索了一种基于语言处理的自动新闻生成和事实核查系统,旨在提高新闻生产的效率和质量,同时确保新闻内容的真实性和可靠性。通过整合事实核查技术,该系统可以有效防止虚假新闻的传播,提高新闻的准确性和可信度,而自动新闻生成和事实核查所涉及的关键技术包括文本生成、信息提取和知识图谱的应用,并通过实验证实了这些技术的有效性。此外,本文讨论了自动新闻生成和事实核查系统的未来发展方向,强调了技术进一步整合和创新的重要性。研究结果表明,随着技术的不断优化和实际应用,这些系统在未来新闻行业中将发挥越来越重要的作用,提供更高效和可靠的新闻服务。
May, 2024
本论文提出了一个新的多语言数据集 MultiClaim,其中包含 28k 个社交媒体帖子和 206k 个来自专业事实核查人员写的 39 种语言的事实核查。我们评估了不同的非监督方法在这个数据集上的效果,并显示对这样一个多样化的数据集进行评估具有复杂性,需要在解释结果之前采取适当的措施。我们还评估了一种监督微调方法,显著提高了非监督方法的性能。
May, 2023
本研究主要讨论了解决当前网络上 “假新闻” 和政客言论真实性验证的问题,提出了一种基于学习排序模型的检索算法,并建立了一个相关数据集,实验结果表明该方法优于现有的基于检索和文本相似度的算法。
May, 2020
该研究综述了当前 NLP 技术在事实核查方面的能力和局限性,并强调将人性化设计方法融入模型开发,早期与事实核查利益相关者合作以及开展支持人性化事实核查技术的基准开发的必要性。
Jan, 2023
提出了一种使用外部来源进行全自动事实核查的通用框架,该框架利用深度神经网络和 LSTM 文本编码结合任务特定的嵌入来判断声称的真实性,并将来自 Web 的相关文本片段融合其中,考虑其来源可靠性,在两个任务和数据集上均表现不错。
Oct, 2017
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019