Nov, 2021

无监督和分布式检测机器生成文本

TL;DR本文提出一种针对机器生成文档与人工撰写文档进行区分的无监督学习方法,通过利用高阶 n 元模型进行分类,并使用疑似标注文档来训练分类器的集合,成功实现了对疑似机器生成文档的准确评估,并且该方法可适用于各种规模的大型语言模型。