EMNLPSep, 2021
TURINGBENCH: 面向神经文本生成时代的图灵测试基准环境
TURINGBENCH: A Benchmark Environment for Turing Test in the Age of Neural Text Generation
Adaku Uchendu, Zeyu Ma, Thai Le, Rui Zhang, Dongwon Lee
TL;DR该研究提出了 TuringBench 基准环境,旨在解决神经文本生成方法的 “图灵测试” 问题,它包括 200K 个人工或机器生成的样本数据集,分别涵盖 20 个标签,以及两个基准测试任务和网站排行榜,研究初步实验表明,FAIR_wmt20 和 GPT-3 是生成最逼近人类无法辨别的文本的最佳选择。