WWWMar, 2024

GPT 生成文本检测:基准数据集与基于张量的检测方法

TL;DR通过 GPT Reddit 数据集(GRiD)和新颖的 GpTen 张量基准模型,本论文提出了一种对 ChatGPT 生成的文本进行检测的方法,旨在评估检测模型在识别 ChatGPT 生成应答方面的性能。该数据集包含了基于 Reddit 的多样化的语境 - 提示对,同时包括了人类生成的应答和 ChatGPT 生成的应答,通过对数据集特征进行分析,如语言多样性、上下文复杂性和应答质量,展示了这个数据集的实用性。实验中比较了几种检测方法,并展示了它们在区分人类和 ChatGPT 生成应答方面的有效性。该数据集为评估和推进 ChatGPT 的检测技术提供了资源,也为确保互联网上负责任和值得信赖的基于 AI 的交流做出了贡献。最后,我们提出了 GpTen 作为一种半监督方法来检测 GPT 生成的文本,该方法仅有人类生成的文本作为参考,并能与完全监督的基准模型表现相当。