EMNLPSep, 2021

TURINGBENCH: 面向神经文本生成时代的图灵测试基准环境

TL;DR该研究提出了 TuringBench 基准环境,旨在解决神经文本生成方法的 “图灵测试” 问题,它包括 200K 个人工或机器生成的样本数据集,分别涵盖 20 个标签,以及两个基准测试任务和网站排行榜,研究初步实验表明,FAIR_wmt20 和 GPT-3 是生成最逼近人类无法辨别的文本的最佳选择。