EMNLPOct, 2020

GRADE:用于评估开放域对话系统的自动图形增强相关性度量

TL;DR本论文提出了一种新的评估指标 GRADE,通过考虑话题转移的动态和话题层面的图形表示,结合粗粒度的话语层面的上下文表示来评估对话的连贯性,从而较好地衡量了各种对话模型的性能并提高了人机相关度。