SEPSIS: 我能察觉你的谎言 —— 一个新的欺骗检测范式

Dec, 2023

SEPSIS: 我能察觉你的谎言 —— 一个新的欺骗检测范式

SEPSIS: I Can Catch Your Lies -- A New Paradigm for Deception Detection

Anku Rani, Dwip Dalal, Shreya Gautam, Pankaj Gupta, Vinija Jain...

TL;DR利用 NLP 技术，研究操纵信息的欺骗行为，特别关注遗漏欺骗，并提出了一个新的欺骗检测框架。研究通过对待欺骗的样本进行多任务学习，取得了强大的性能，并发现遗漏欺骗与宣传技术之间的显著相关性。

Abstract

deception is the intentional practice of twisting information. It is a nuanced societal practice deeply intertwined with human societal evolution, characterized by a multitude of facets. This research explores the problem of →

deception lies of omission nlp techniques deception detection propaganda techniques

发现论文，激发创造

说真话：欺骗的语言与语言模型

基于一项新型电视游戏节目数据的分析，我们检验了在目标真相存在的情况下，人们辨别文本内容真实性的能力，显示了存在一类能够与人类具有相似真相检测性能的检测器模型，这一模型基于大型语言模型，通过学习可分辨线索来确定真相，该模型在很多情况下能够检测出人类无法察觉的欺骗语言线索，并为与算法的协作提供了可能，进而增强人类的真相检测能力。

Nov, 2023

多语种、多模态领域无关欺骗检测路线图

通过使用多语言变形器模型和多语言标注数据，对跨语言和跨模态的虚假语言进行全面研究，以解决在计算机安全和自然语言处理领域的虚假检测任务。

May, 2024

人与机器协作的虚假信息检测：立场、情感，还是其他什么？

该论文研究了如何利用情感分析、面向方面的情感分析和立场检测等机器学习技术以开发部分自动化的虚假新闻检测系统，并使用 COVID-19 散布虚假信息的四个数据集来测试这些技术的有效性

Nov, 2021

警惕欺骗：通过受控声明编辑检测半真相并揭穿其真相

我们创建了一个包含半真实检测模型和声明编辑模型的综合流程，通过使用 T5 模型进行闭环控制的声明编辑来帮助解决互联网上半真实言论的问题。我们的方法在编辑后的声明上实现了平均 BLEU 得分为 0.88，并且 85% 的虚假揭穿得分。重要的是，相比于 GPT2、RoBERTa、PEGASUS 和 Tailor 等其他语言模型，我们基于 T5 的方法在虚假揭穿得分上平均提升了 82%、57%、42% 和 23%。通过扩展 LIAR PLUS 数据集，我们的半真实检测模型达到了 82% 的 F1 得分，创造了领域的新纪录。虽然以前有过半真实检测的尝试，但我们的方法是我们所知道的第一个试图揭穿半真实言论的。

Aug, 2023

领域无关的欺骗：一种新的分类法和语言分析

互联网经济和社会正深陷欺骗性攻击之中，包括假新闻、网络钓鱼和职位欺诈等，我们将其称为 “欺骗领域”；这篇论文研究了领域无关的欺骗，提出了欺骗的新计算定义和分类，并分析了语言线索对欺骗的辩论，并提供了系统综述的指导，最后调查了常见的语言特征，并证明了不同欺骗形式之间的知识转移。

Feb, 2024

情感检测在虚假信息中的应用：一项综述

社交媒体兴起以来，越来越多的网民在线上分享和阅读帖子和新闻。然而，泛滥于互联网的大量错误信息（例如虚假新闻和谣言）会对人们的生活产生负面影响，这引发了对谣言和虚假新闻检测的热门研究课题。网民在社交媒体帖子和新闻中表达的情绪和情感是帮助区分虚假新闻和真实新闻，以及理解谣言传播的重要因素。本文全面回顾基于情绪的误信息检测方法。我们首先解释情绪与误信息之间的紧密联系。接着，我们详细分析了多种基于情绪、情感和立场特征的误信息检测方法，描述它们的优势和劣势。最后，我们讨论了基于大型语言模型的基于情绪的误信息检测面临的一些挑战，并提出了未来的研究方向，包括数据收集（多平台、多语言）、标注、基准测试、多模态以及可解释性。

Nov, 2023

运用有说服力的写作策略进行虚假信息检测

本研究旨在利用自然语言处理技术，通过对语言文本中的说服写作技巧进行分类，进一步提高自动化的谣言检测的准确性与可理解性。通过利用 RoBERTa 模型的高性能，本研究提出了多种基于语言模型的基准测试，研究表明标注分类的数据可以提高谣言检测的准确性与可理解性。

Nov, 2022

欺骗检测是否能更深入？欺骗推理的数据集、评估和基准

为了解决数据匮乏的问题，本文提出一种新的数据收集方法，使用 GPT-4 模拟嫌疑人和警官之间的角色扮演，并将传统的欺骗检测任务扩展到欺骗推理，以提供更多的证据。这个数据集还可以评估当前大型语言模型的复杂推理能力，并作为进一步研究的推理基准。

Feb, 2024

Liar, Liar Pants on Fire”: 一个新的用于假新闻检测的基准数据集

本研究介绍了 Liar 数据集以及一种新型卷积神经网络，该网络能够结合元数据和文本进行表面级别的自动虚假新闻检测，这个可用于事实核查，工具使得这种检测基于事实上的文章变得更容易，从而减少虚假信息带来的实际影响。

May, 2017

使用双模态卷积神经网络从语言和生理数据流中进行欺诈检测

利用卷积神经网络对多模态欺骗检测进行研究，从数据中提取语言和生理特征以训练神经网络模型，提出了融合两种模态的卷积神经网络模型，与早期方法相比，我们的系统表现更优，初步证明在数据有限的情况下使用神经网络进行欺骗检测是可行的。

Nov, 2023