Apr, 2022

使用多维建模适应新动作集的对话策略调整

TL;DR使用多维方法对话管理加速训练,通过预先训练的任务无关策略来实现转移学习,从而在有限的训练数据下实现更好的性能,人工用户评估表明多维系统(针对目标情境的有限训练数据进行适应)比一维基准(在同样的训练数据上不进行适应)提高了 7%的成功率。