Feb, 2022

修复裂开的基础:生成文本评估实践中的障碍调查

TL;DR本文对自然语言生成中的模型评估进行了综述,分类,以及讨论该领域内研究人员针对这些问题所做的工作,提出了一个长期的 NLG 评估愿景,并建议研究人员采取具体措施来改善他们的评估过程。最终,从 66 篇近期 NLP 会议的 NLG 论文中分析了研究人员在遵循这些建议方面的情况,并确定了需要更彻底改变现状的领域。