NewsClaims: 一种利用属性知识进行新闻谣言检测的新基准
本文针对不同主题下识别值得检查的权利要求的挑战进行了评估和量化,提出了 AraCWA 模型来减轻跨主题检测具有检查价值权利要求时的性能下降,该模型通过少量学习和数据增强来为新的主题提高性能,并使用公开数据集的阿拉伯语推文,为不同的主题证明了文章提出的数据增强策略取得了显著的改进。
Dec, 2022
本文介绍了利用专业事实核查人员的专业知识,开发了一种基于通用句子表示的方法来检测声明,其分类时的 F1 值高达 0.83,相对于现有方法 ClaimBuster 和 ClaimRank 提升了超过 5%。
Sep, 2018
本研究提出使用自然语言处理技术来提高事实核查的效率,从而解决新闻界预算紧缩和虚假信息不断蔓延的问题。该方法能够将待核查信息与已有语料库进行比对,返回相似、已经过事实核查的信息,从而实现多人同时核查而不重复工作。
Jul, 2019
我们提出了一个基于本体增强模型的句子级主张检测方法,通过将来自知识库的本体嵌入与 BERT 句子嵌入相融合,对 ClaimBuster 和 NewsClaims 数据集进行主张检测。我们的本体增强方法在这些小型非均衡数据集上展示出了最佳结果,相比其他统计和神经机器学习模型。实验表明,添加领域特定特征(训练词嵌入或知识图谱元数据)可以改善传统的机器学习方法。此外,以本体嵌入的形式添加领域知识有助于避免在神经网络模型中遇到的偏见,例如纯 BERT 模型在我们的小语料库中对较大类别的偏倚。
Feb, 2024
自动化生成证明(说明为何某主张被分类为真或假)的过程在抵制虚假信息方面起到重要作用,这篇论文针对无结构知识(如新闻文章)的摘要方法进行了实验证明,结果显示,通过基于主张信息的抽取步骤改善摘要性能可以从证明生成摘要中获益。
Aug, 2023
本文介绍了一种用于从生物医学领域的科学文章摘要中提取科学主张的模型,该模型使用传递学习技术进行微调,并将其与基于规则和深度学习技术的几个基准模型进行比较。最终模型使用微调后的传递学习技术与基准模型相比,其 F1 得分提高了 14 个百分点。同时,作者还提供了一个公共工具用于进行论述和主张的预测以及注释工具,并探讨了其在生物医学文献以外的其他应用。
Jul, 2019
本文提出了 Claim Span Identification (CSI) 任务并引入了名为 CURT 的大规模 Twitter 语料库,通过基于 RoBERTa 的适配器 DABERTa 进行实验来对其数据进行基准测试,并提供了细致的误差分析和消融研究来验证该模型的性能,并提供了全面的跨度注释指南以供公共使用。
Oct, 2022
在线社交媒体平台的快速发展使内容创作和信息交流大幅增加,然而这些平台也成为了散布虚假信息、宣传和假新闻的温床。为了解决这个问题,社交媒体巨头雇佣内容审核员来过滤虚假新闻。然而,庞大的信息量使得有效辨别虚假新闻变得困难,因此自动识别发出此类言论的社交媒体帖子、核实其真实性并区分可信与虚假言论变得至关重要。
Oct, 2023
介绍了一个人本中心的框架 ClaimVer,通过生成丰富的注释来满足用户的信息和验证需求,减少认知负荷,清晰地验证每个声明,提供清晰简明的解释,增强了广泛应用于各种下游任务的适用性。
Mar, 2024
本文提出了科学申明生成任务,旨在从科学句子中生成一个或多个原子可验证主张,并证明其在生物医学声称的零 - shot 事实检查中的有效性,提出了以下三种方法 CLAIMGEN-BART、KBIN 和 CLAIMGEN-ENTITY,其在事实检查上表现良好。
Mar, 2022