EMNLPOct, 2022

MultiWOZ 是一个已解决的任务吗?带有用户模拟器的交互式 TOD 评估框架

TL;DR本文提出了一种交互式评估框架用于任务指向对话(TOD)系统,通过构建用户目标的预训练模型和使用用户模拟器来交互评估,实验结果表明,我们的提议可以实现与多 WoZ 数据集中的 TOD 任务 98%的成功率和信息率,并引入了句子层和会话层得分来衡量响应质量。