ACLMay, 2022
拆解自然语言生成评估:评估实践、假设及其影响
Deconstructing NLG Evaluation: Evaluation Practices, Assumptions, and Their Implications
Kaitlyn Zhou, Su Lin Blodgett, Adam Trischler, Hal Daumé III, Kaheer Suleman...
TL;DR通过对 18 位自然语言生成技术从业者的形成性半结构化访谈和 61 位从业者的调查研究,我们展示了影响自然语言生成技术评估的目标、社区实践、假设和约束,以及它们所体现的伦理考虑。