Jan, 2024

用双筒望远镜发现 LLMs:机器生成文本的零样本检测

TL;DR利用两个紧密相关的预训练大型语言模型之间的对比得分,我们提出了一种新颖的仅需要使用这对 LLM 进行简单计算的 LLM 检测器,名为 Binoculars,它在不需要任何训练数据的情况下实现了最先进的准确性,能够在各种现代 LLM 的文本中发现机器生成的文本。在多种文档类型并且各个情况下,我们全面评估了 Binoculars 的性能,它以 0.01% 的误报率能够检测到 ChatGPT(和其他 LLM)生成的样本中超过 90% 的文本,尽管它没有接受任何 ChatGPT 数据的训练。