Feb, 2022

学术出版物中自动生成文本检测基准语料库

TL;DR本研究提出两个数据集,一个完全由 GPT-2 模型生成的合成数据集和一个部分用 Arxiv-NLP 模型生成的文本替换数据集,评估数据集的质量,难度以及分类模型的区分能力。