May, 2024

谁写的?零样本长文本生成文本检测的关键是 GECScore

TL;DR提出一种基于语法错误修正分数(GECScore)计算的黑盒零样本检测方法,通过区分人工编写和大型语言模型生成的文本,在零样本和有监督方法方面显著优于现有技术,获得平均 AUROC 为 98.7%的结果,并对近义词和对抗扰动攻击具有很强的鲁棒性。