COLINGSep, 2022

使用跟进概率进行开放域对话评估

TL;DR本研究提出一种新的自动对话评估方法,使用固定的跟进集合(例如,这里没有真正相关的内容,你想说什么),测量语言模型继续对话的概率。相对于现有的 12 种评估方法,本方法与人类评估的相关性最高。