ACLSep, 2023

RADE:基于参考的开放领域对话评估

TL;DR使用参考答案辅助的多任务学习框架可以评估开放领域对话系统,有效解决多对多问题,通过人工标注获取多个评分而非仅限于黄金答案,实验证明该方法优于现有基准。