ACLMay, 2018

人工评价与自动评价:相关性设计的重要性

TL;DR本文讨论了在自然语言生成领域中,自动评估度量和人类评分之间相关性分析的两种方法。我们的实验表明,根据使用系统级或句子级相关性分析,自动评分和人类判断之间的相关性结果是不一致的。