ACLApr, 2022

灵活吸收逐轮表现的对话状态跟踪公正评价

TL;DR本文介绍了对话状态跟踪的常用评估方法 Joint Goal Accuracy,分析了其缺陷,提出了一种新的评估指标 Flexible Goal Accuracy,该指标灵活地考虑了累计和单独分开预测的准确性,以提高对 DST 模型性能的鉴别力。