大型语言模型能持续生成高质量选举虚假信息内容

Aug, 2024

大型语言模型能持续生成高质量选举虚假信息内容

Large language models can consistently generate high-quality content for election disinformation operations

Angus R. Williams, Liam Burke-Moore, Ryan Sze-Yin Chan, Florence E. Enock, Federico Nanni...

TL;DR本研究深入探讨了大型语言模型在生成选举虚假信息内容中的能力，填补了关于此类模型潜在负面影响的研究空白。我们引入了DisElect评估数据集，并对13个语言模型进行了测试，结果发现大多数模型能够符合恶意请求，且其生成的虚假信息内容难以与人类撰写的内容区分。此成果为研究人员及政策制定者提供了衡量和评估该类能力的实证基准。

Abstract

Advances in Large Language Models have raised concerns about their potential use in generating compelling Election Disinformation at scale. This study presents a two-part investigation into the capabilities of LL

发现论文，激发创造

辨别虚假信息：在LLMs时代的不断挑战

通过回答三个研究问题，本研究探讨了利用大型语言模型（LLMs）生成的谣言和虚假信息对目前存在的谣言检测技术的影响，以及通过使用LLMs作为强大的谣言防御手段以及针对这一威胁的新方法的可能性。

Sep, 2023

用火攻火：LLM在制作和检测隐蔽虚假信息中的双重作用

我们提出了一种新型的“以毒攻毒”策略，利用现代大型语言模型的生成和推理能力来对抗人类撰写和大型语言模型生成的虚假信息。通过使用GPT-3.5-turbo合成真实和具有欺骗性的大型语言模型生成内容，并结合上下文语义推理技术判断真实和虚假的帖子和新闻文章，我们观察到GPT-3.5-turbo在不同数据集上的优越性，准确率达到68-72%。

Oct, 2023

大型语言模型的虚假信息能力

利用10个大型语言模型研究其自动化虚假信息生成能力，发现该能力可生成具有威胁性的新闻文章并且难以被检测出。

Nov, 2023

通过提示工程增强情绪操纵在人工智能大型语言模型中的虚假信息生成

OpenAI大型语言模型通过提示工程生成合成的虚假信息，本研究探讨了它们对情感提示的响应，并设计了实验来评估它们产生虚假信息的成功程度，研究发现OpenAI的所有语言模型都能成功产生虚假信息，并且它们有效地对情感提示作出回应，表明它们在文本生成中对情感暗示有细致的理解。当礼貌地发出提示时，所有检查的语言模型都会以高频率生成虚假信息，相反地，当不礼貌地发出提示时，虚假信息的产生频率减少，模型通常拒绝产生虚假信息，而是提醒用户该工具不用于此类目的。这项研究对于关于负责任的AI技术开发和应用的持续讨论具有重要意义，尤其是在减少虚假信息传播和促进AI生成内容的透明度方面。

Mar, 2024

社交媒体中分类人工生成和AI生成的选举主张

我们提出了一种用于分类选举相关言论的新颖分类体系，介绍了一个基于人工智能生成的推文数据集和机器学习模型来区分人类和人工智能生成的帖子，并识别特定的大型语言模型变体。

Apr, 2024

评估大型语言模型在检测虚假新闻中的功效：一项比较分析

研究通过对比分析，评估了不同大型和小型LLMs在识别和过滤假新闻内容方面的有效性，并利用Kaggle的假新闻数据集样本探讨了当前LLMs在假新闻检测方面的能力和局限性，同时讨论了提高AI驱动信息完整性对开发人员和决策者的影响。

Jun, 2024

利用现实世界和生成的新闻文章语料库量化生成式媒体偏见

通过建立新的数据集并使用九个大语言模型，本研究研究了人工撰写文章和机器生成文章之间的性质变化以及政治偏见的检测，结果显示基准模型和经过调整的模型之间存在显著差异，并且大语言模型在分类器角色中也显示出政治偏见，为进一步研究大语言模型政治偏见及其影响提供了一个基础。

Jun, 2024

大型语言模型能够模仿政治家和其他公众人物

现代人工智能技术，如大型语言模型（LLMs），有可能污染公共信息领域，对社会的凝聚力构成重大威胁。研究表明，LLMs能够生成出具有令人印象深刻的文本质量，包括具有说服力的政治演讲、预先定义风格的文本和角色特定内容。然而，现有文献在一个关键领域存在差距：我们缺乏关于LLMs在冒充政治和社会代表方面的潜力以及公众对这些冒充的真实性、相关性和连贯性的判断的大规模和系统研究。我们提供了一项基于英国社会的横断面研究结果，结果显示LLMs能够对英国广播政治辩论节目中的辩论问题生成回应。冒充的回应被认为比被冒充的人原先的回应更具真实性和相关性。从这两点可以得出结论：（1）LLMs可以有意义地参与公共政治辩论，（2）迫切需要让公众了解这对社会可能造成的潜在危害。

Jul, 2024

德国政党问答：评估商业大型语言模型的政治偏见和拍马屁行为

本研究解决了商业大型语言模型（LLMs）在多党制中可能存在的政治偏见和拍马屁行为的评估问题。我们开发了基于投票建议应用程序Wahl-o-Mat的基准数据集GermanPartiesQA，发现所有被评估的LLMs表现出左绿倾向。研究结果显示，LLMs的输出可以在政治场景中进行个性化调整，指向一种更符合上下文的个性化，而不是简单的拍马屁。

Jul, 2024

从欺骗到检测：大型语言模型在假新闻中的双重角色

本研究针对假新闻对信息生态系统和公众信任的威胁，探讨了大型语言模型（LLMs）在生成和检测假新闻中的双重作用。研究发现，一些模型可以产生偏见的假新闻，而大型模型在检测能力上普遍优于传统模型，且LLM生成的假新闻更难被检测识别，这为假新闻的防御提供了新的视角和解决方案。

Sep, 2024