Jul, 2022

基于动作嵌入的多领域对话策略的强化学习

TL;DR该研究提出使用跨领域数据的方法来优化强化学习中基于任务的对话策略并减少所需数据量,具体方法为学习领域无关的动作嵌入,这些嵌入能够更快速准确地在模拟环境中训练策略。