NewsClaims: 一种利用属性知识进行新闻谣言检测的新基准

EMNLPDec, 2021

NewsClaims: 一种利用属性知识进行新闻谣言检测的新基准

NewsClaims: A New Benchmark for Claim Detection from News with Attribute Knowledge

Revanth Gangi Reddy, Sai Chetan, Zhenhailong Wang, Yi R. Fung, Kathryn Conger...

TL;DR本文提出了一个新的基准测试工具 NewsClaims，该工具包含了 889 个标注的声明，目的是为了测试在新闻领域中与声明相关的属性感知的声明检测系统，促进信息真实性和假消息检测技术的发展。

Abstract

claim detection and verification are crucial for news understanding and have emerged as promising technologies for mitigating misinformation

claim detection verification misinformation disinformation newsclaims

发现论文，激发创造

自动事实核查中的跨主题值得核实声明检测

本文针对不同主题下识别值得检查的权利要求的挑战进行了评估和量化，提出了 AraCWA 模型来减轻跨主题检测具有检查价值权利要求时的性能下降，该模型通过少量学习和数据增强来为新的主题提高性能，并使用公开数据集的阿拉伯语推文，为不同的主题证明了文章提出的数据增强策略取得了显著的改进。

Dec, 2022

自动事实核查：开发一种注释模式和基准，以实现一致的自动索赔检测

本文介绍了利用专业事实核查人员的专业知识，开发了一种基于通用句子表示的方法来检测声明，其分类时的 F1 值高达 0.83，相对于现有方法 ClaimBuster 和 ClaimRank 提升了超过 5%。

Sep, 2018

实时从新闻文章中检测索取含义相似的事实核查

本研究提出使用自然语言处理技术来提高事实核查的效率，从而解决新闻界预算紧缩和虚假信息不断蔓延的问题。该方法能够将待核查信息与已有语料库进行比对，返回相似、已经过事实核查的信息，从而实现多人同时核查而不重复工作。

Jul, 2019

本体增强的索赔检测

我们提出了一个基于本体增强模型的句子级主张检测方法，通过将来自知识库的本体嵌入与 BERT 句子嵌入相融合，对 ClaimBuster 和 NewsClaims 数据集进行主张检测。我们的本体增强方法在这些小型非均衡数据集上展示出了最佳结果，相比其他统计和神经机器学习模型。实验表明，添加领域特定特征（训练词嵌入或知识图谱元数据）可以改善传统的机器学习方法。此外，以本体嵌入的形式添加领域知识有助于避免在神经网络模型中遇到的偏见，例如纯 BERT 模型在我们的小语料库中对较大类别的偏倚。

Feb, 2024

事实核查解释生成的基准测试

自动化生成证明（说明为何某主张被分类为真或假）的过程在抵制虚假信息方面起到重要作用，这篇论文针对无结构知识（如新闻文章）的摘要方法进行了实验证明，结果显示，通过基于主张信息的抽取步骤改善摘要性能可以从证明生成摘要中获益。

Aug, 2023

使用深度语篇模型和迁移学习提取生物医学出版物中的声明

本文介绍了一种用于从生物医学领域的科学文章摘要中提取科学主张的模型，该模型使用传递学习技术进行微调，并将其与基于规则和深度学习技术的几个基准模型进行比较。最终模型使用微调后的传递学习技术与基准模型相比，其 F1 得分提高了 14 个百分点。同时，作者还提供了一个公共工具用于进行论述和主张的预测以及注释工具，并探讨了其在生物医学文献以外的其他应用。

Jul, 2019

Twitter 上声明段落的自动识别：事实检查者的赋能

本文提出了 Claim Span Identification (CSI) 任务并引入了名为 CURT 的大规模 Twitter 语料库，通过基于 RoBERTa 的适配器 DABERTa 进行实验来对其数据进行基准测试，并提供了细致的误差分析和消融研究来验证该模型的性能，并提供了全面的跨度注释指南以供公共使用。

Oct, 2022

CLAIMSCAN-2023: 社交媒体中揭示真相的概述 —— 通过索引主张的检测和识别

在线社交媒体平台的快速发展使内容创作和信息交流大幅增加，然而这些平台也成为了散布虚假信息、宣传和假新闻的温床。为了解决这个问题，社交媒体巨头雇佣内容审核员来过滤虚假新闻。然而，庞大的信息量使得有效辨别虚假新闻变得困难，因此自动识别发出此类言论的社交媒体帖子、核实其真实性并区分可信与虚假言论变得至关重要。

Oct, 2023

ClaimVer: 文本的可解释的声明级验证和证据归属通过知识图谱

介绍了一个人本中心的框架 ClaimVer，通过生成丰富的注释来满足用户的信息和验证需求，减少认知负荷，清晰地验证每个声明，提供清晰简明的解释，增强了广泛应用于各种下游任务的适用性。

Mar, 2024

生成零样本科学事实检查的科学主张

本文提出了科学申明生成任务，旨在从科学句子中生成一个或多个原子可验证主张，并证明其在生物医学声称的零 - shot 事实检查中的有效性，提出了以下三种方法 CLAIMGEN-BART、KBIN 和 CLAIMGEN-ENTITY，其在事实检查上表现良好。

Mar, 2022