利用相对概率频谱检测人类和模型语言之间的微小差异

Jun, 2024

利用相对概率频谱检测人类和模型语言之间的微小差异

Detecting Subtle Differences between Human and Model Languages Using Spectrum of Relative Likelihood

Yang Xu, Yu Wang, Hao An, Zhichen Liu, Yongyuan Li

TL;DR通过使用相对似然值而非绝对似然值，并从似然的频谱视图中提取有用的特征，本研究提供了一种新的视角来检测人类和模型生成的文本。我们提出了一种具有两种分类方法（监督和基于启发式的）的检测程序，其效果与以前的零样本检测方法相当，并在短文本检测上取得了最新的最先进的结果。我们的方法还可以揭示人类语言和模型语言之间的细微差异，这些差异在心理语言学研究中有理论根源。

Abstract

Human and model-generated texts can be distinguished by examining the magnitude of likelihood in language. However, it is becoming increasingly difficult as language model's capabilities of generating human-like texts keep evolving. This study provides a new perspective by using the relative

发现论文，激发创造

语言模型评估：超越困惑度

我们提出了一个替代方法来量化语言模型学习自然语言的程度：我们询问它们多大程度上与自然语言的统计倾向相匹配。通过分析语言模型生成的文本是否呈现出它们所训练的人类生成文本中存在的统计倾向，提供了一个与显著性测试配对的框架来评估语言模型的拟合程度。我们发现神经语言模型似乎只学会了一部分被考虑的倾向，但与经验性趋势相比，更接近所提出的理论分布（当存在时）。此外，对不同分布的拟合程度高度依赖于模型架构和生成策略。作为具体例子，使用Nucleus sampling方式生成的文本比使用标准祖先抽样生成的文本更紧密地遵循自然语言的类型-标记关系；LSTMs生成的文本也非常好地反映了自然语言的长度、停用词和符号分布。

May, 2021

测试自然语言模型预测人类语言判断的界限

通过有争议的句子对比较，研究人员发现GPT-2是最符合人类语言处理的神经网络语言模型，但也存在与人类感知不符的缺陷。

Apr, 2022

真假文本？：探究人类识别人写与机器生成文本边界的能力

本文研究了如何使用最先进的神经语言模型使人工创作的文本过渡为文本生成，并且展示了该任务上的众议员的技能差异。通过比较多种变量的影响，我们收集了RoFT数据集，以鼓励未来在人工检测和评估生成的文本方面进行更多的研究。

Dec, 2022

小型语言模型更适合于黑盒子机器生成文本检测

本研究旨在通过训练检测器以区分生成文本与人类编写文本，并发现适用于小且部分训练的生成模型更易检测。检测器与生成器是否基于相同数据不影响检测结果。

May, 2023

DetectLLM：利用对数秩信息进行零样本检测机器生成的文本

本文介绍了两种利用对数排名信息进行无样本检测的新型机器生成文本检测方法，分别为快速高效的DetectLLM-LRR和更加精确但需要扰动的DetectLLM-NPR，实验证明两种方法分别优于现有技术 3.9 和 1.75 AUROC 点的绝对值。

May, 2023

大型语言模型中利用标签变异进行零样本文本分类

使用5种最先进的大型语言模型（LLMs）作为“标注者”在多个任务上进行评估，并比较其与人类标注的优缺点。总体而言，尽管LLMs在某些任务上表现出色，但它们无法替代人类标注的需求。

Jul, 2023

从文本到来源：大型语言模型生成内容的检测结果

通过探索跨模型检测、模型归因以及分类器的效果与模型规模之间的关系，该研究在大型语言模型的使用中提供了宝贵的见解。

Sep, 2023

英法德西语人工智能与人类生成文本分类

本文分析了用于英语、法语、德语和西班牙语识别人工智能生成文本和人类生成文本的特征，并对不同语言进行了比较。研究了两种情况：(1) 检测由人工智能生成的原创文本，和 (2) 检测由人工智能重新表述的文本。通过建立包含每种语言10个主题的新文本语料库来训练和测试这个多语言环境中的分类器。特征的组合在检测人工智能生成的文本时表现最好，说明这些特征可以应用于其他相关语言：西班牙语的F1得分接近99%，英语为98%，德语为97%，法语为95%。在检测人工智能重新表述的文本时，大多数情况下使用所有特征的系统效果最好，但对于德语（72%）和西班牙语（86%），仅使用文档特征最好，而对英语则仅使用文本向量特征可获得最佳结果（78%）。

Dec, 2023

基于风格表示的机器生成文本的少样本检测

利用人类文本估计的写作风格来区分人类作者和机器作者，以及预测给定文档由哪个语言模型生成。

Jan, 2024

小型语言模型也很不错：一项零样本分类的实证研究

该研究评估了使用不同参数和结构的小型语言模型在零射击文本分类中的性能，并发现小型模型在分类文本方面表现出色，与或超过了更大的模型，这一发现强调了资源高效的小型模型可能为特定的数据分类挑战提供可行的解决方案。

Apr, 2024