Aug, 2023

利用高阶批判方法分离人工智能生成的文字中的人为因素:一种信息论方法

TL;DR我们提出了一种方法,可以确定给定文章是完全由生成式语言模型编写还是在不同作者(可能是人类)的情况下经过了一些重大编辑。我们的方法涉及多个感到困惑的测试来判断单个句子或其他文本单元的来源,并使用 Higher Criticism 方法结合这些多个测试。该方法通过接近对数困惑度与交叉熵率的收敛以及针对编辑文本的统计模型,表明大部分句子都是由语言模型生成的,但也可能有一些句子是通过不同的机制产生的。我们通过使用真实数据展示了我们方法的有效性,并分析了影响其成功的因素。这项分析提出了一些有趣的未解决问题,解决这些问题可能会提高该方法的效果。