May, 2018

面向任务的神经对话模型的对抗学习

TL;DR本文介绍了一种使用对抗性学习方法进行奖励估计的强化学习(RL)的任务导向型对话模型,该方法在一个餐厅搜索场景中实现了较高的对话成功率。