Apr, 2023

CHEAT:用于检测 ChatGPT 写作的大规模数据集

TL;DR研究了 ChatGPT 对学术界原创性和严谨性的可能负面影响,并提出了一个大规模数据集以支持检测算法的开发。该数据集包含了 35,304 个合成摘要,同时对现有的文本合成检测算法进行了深入分析,表明 ChatGPT 合成的摘要是可以被检测出来的,但随着人类参与的增加,检测难度会增加。