Jun, 2024

利用相对概率频谱检测人类和模型语言之间的微小差异

TL;DR通过使用相对似然值而非绝对似然值,并从似然的频谱视图中提取有用的特征,本研究提供了一种新的视角来检测人类和模型生成的文本。我们提出了一种具有两种分类方法(监督和基于启发式的)的检测程序,其效果与以前的零样本检测方法相当,并在短文本检测上取得了最新的最先进的结果。我们的方法还可以揭示人类语言和模型语言之间的细微差异,这些差异在心理语言学研究中有理论根源。