Mar, 2023

改述检测:人类与机器内容

TL;DR本文旨在分析大型语言模型如 GPT-4 和 ChatGPT 等的语言生成和改写能力的特点和限制及其对学术诚信的挑战,探讨人工改写和机器改写之间的区别,并对常用的数据集进行综合分析和评估,结果显示自动生成文本的水平仍不及人类普及水平,适合于语义多样性语料的 TF-IDF 方法的效果最好,同时,发现了四个语义多样性和挑战性最高的数据集。