May, 2023

LLMDet: 一种大型语言模型检测工具

TL;DR本文提出了一种高效、安全、可扩展的检测工具 LLMDet,通过利用预训练获得的模型下一个令牌概率的先验信息,计算文本的代理困惑度,并使用通过代理困惑度测量的模型的自身水印信息来检测文本的来源;同时,在识别人类撰写的文本方面实现了 97.97% 的识别准确率,并在识别生成语言模型方面显示出了很好的结果。