Jan, 2016

SimpleDS:一种简单的深度强化学习对话系统

TL;DR本文介绍了使用深度强化学习训练的简单,公开的对话系统 SimpleDS,该系统直接从上一个系统的原始文本和(嘈杂的)用户响应进行操作选择,避免了手动特征生成,并显示该方法可使智能交互代理的对话控制自动化程度更高。在 restaurant 领域,我们的初步成果表明,引导合理的对话行为是可能的。