Oct, 2022

简化生成结构的用户模拟器和任务驱动对话系统的联合强化学习

TL;DR本研究首次探讨了使用在线增强学习的基于 GPT-2 的对话系统和端到端用户模拟器,并提出了简化的生成架构作为 DS 和 US 的模型,使用缩短的历史,同时展示了 SGA-JRUD 模型在离线和在线评估中的优异表现。