ACLMay, 2021

OpenMEVA:用于评估开放式故事生成指标的基准

TL;DR该研究提出了 OpenMEVA 标准,用于评估故事生成指标的能力,揭示了现有的自动度量标准与人类评估的相关性不足,并且缺乏推理能力,该研究为进一步研究自然语言生成模型和指标提出了启示。