通过大型语言模型检测标题党

Jun, 2023

Clickbait Detection via Large Language Models

Yi Zhu, Han Wang, Ye Wang, Yun Li, Yunhao Yuan...

TL;DR本研究旨在研究大语言模型是否适用于高质量的点击诱饵检测系统，并通过在多个英文和中文基准数据集上进行的实验结果表明，LLMs 不能实现与最先进的深度微调方式相比的最佳结果，对于检测点击诱饵文本，仅仅使用标题是不够的。

Abstract

clickbait, which aims to induce users with some surprising and even thrilling headlines for increasing click-through rates, permeates almost all online content publishers, such as news portals and social media. Recently, Large Language Models (LLMs) have emerged as a powerful instrumen

clickbait large language models nlp few-shot learning detecting clickbaits

发现论文，激发创造

探索大型语言模型在识别误导性新闻标题中的潜力

利用大型语言模型（LLMs），本文研究了识别误导性与非误导性新闻标题的效果。研究发现模型性能存在显著差异，ChatGPT-4 在一致标注者就误导性标题达成一致意见的情况下表现出更准确的结果。文章强调了人本评估在开发 LLMs 中的重要性，旨在将技术能力与细腻的人类判断力相结合。研究结果对 AI 伦理问题具有借鉴意义，强调了在技术先进的同时，还需要考虑伦理道德和人类解读的微妙性。

May, 2024

大型语言模型对于生成有害内容的鱼目混珠攻击存在漏洞

通过诱饵和转换攻击，大型语言模型能够将安全文本转化为有害内容，这提醒我们在开发可靠的安全保护机制时需要考虑后续转换。

Feb, 2024

适应大语言模型时代的假新闻检测

本文研究了大型语言模型时代中的假新闻检测问题，发现仅训练于人工编写文章的检测器在检测机器生成的假新闻方面表现良好，但反之不成立。此外，由于检测器对机器生成的文本存在偏见，需要在训练集中使用比测试集中较低比例的机器生成新闻。基于我们的发现，我们提供了一个实用的策略来开发健壮的假新闻检测器。

Nov, 2023

使用神经网络识别网络新闻中的标题党

本研究提出了一种使用深度学习方法来检测 2017 年 Clickbait Challenge 数据集中的 clickbaits 的模型，同时利用数据分析和可视化技术探索和发现数据集中的信息。该模型在均方误差方面在 Clickbait Challenge 2017 中获得了第一名。

Jun, 2018

大型语言模型能否检测科学新闻报道中的错误信息？

使用大型语言模型检测科学报道中的虚假信息，针对缺乏明确标签的情况，提出了多种基于大型语言模型的基准架构和提示方法，包括零样本、少样本和连贯思维提示等。

Feb, 2024

使用大型语言模型集合生成点击标题剧透

提出了一种基于经过优化的大规模语言模型集合的点击诱饵剧透生成方法，不局限于短语或段落剧透，还能生成涉及文本中非连续部分的多部分剧透；实验评估结果表明，该集合模型在 BLEU、METEOR 和 BERTScore 指标上优于基准模型。

May, 2024

LOLA: 基于 LLM 的在线学习算法用于内容实验

该研究介绍了一种名为 LLM 辅助在线学习算法（LOLA）的新型框架，通过将大型语言模型（LLMs）与自适应实验相结合，优化内容传递，以提高用户参与度。研究结果表明，与传统 A/B 测试方法相比，LOLA 在有限的实验流量或多种实验情境下表现更好，特别适用于数字广告和社交媒体推荐等各种数字环境中的内容实验。

Jun, 2024

大型语言模型是否能理解内容和传播路径以检测虚假信息：一个实证研究

大型语言模型在虚假信息检测任务中的性能研究显示，多样的启发式方式和多个实例学习策略可以提高大型语言模型在文本和传播结构理解方面的检测性能，突出了大型语言模型检测虚假信息的潜在能力。

Nov, 2023

大型语言模型八大要点

该论文调查了大型语言模型的八个潜在问题，包括其预测能力的增强，不可预测的行为的出现，对外部世界的学习和使用表示，行为引导技术的不可靠性，内部工作方式的解释困难性，性能上界不是人类任务表现，不一定表达其创建者或网络文本编码的价值观，与 LLMs 的简短交往经常是误导性的。

Apr, 2023

大型语言模型生成的文本受到假新闻检测器的偏见

在大语言模型 (LLMs) 时代，我们发现许多现有的假新闻检测器存在显著偏见，更容易将 LLMs 生成的内容标记为假新闻，而常常误将人类撰写的假新闻分类为真实。为了解决这个问题，我们引入了一种对抗训练与 LLMs 重写的真实新闻相结合的缓解策略，从而在人类和 LLMs 生成的新闻的检测准确性方面取得了显著的改进。为了进一步推动该领域的研究，我们发布了两个全面的数据集 “GossipCop++” 和 “PolitiFact++”，将经人工验证的文章与 LLMs 生成的假新闻和真实新闻相结合。

Sep, 2023