ACLApr, 2019

将人类和统计评估统一为一体:自然语言生成

TL;DR本文提出了一个统一的框架来评估 “人或机器生成” 的句子的错误率,并结合人类和统计学的评估来评估自然语言生成系统的多样性和质量,带来了更准确和全面的结果。