EMNLPJan, 2021

GENIE:面向文本生成的可重复和标准化人类评估技术

TL;DR该研究关注文本生成的人类评估问题,通过注释设计选择和人类评估数据,提出一种自动化去除噪音注释者的机制,并基于此开发了 GENIE 系统,用于跨不同任务运行标准化的人类评估,提供总排行榜,已在四个核心文本生成任务上进行测试。