ICLRJul, 2018

基于对话行为的可解释可控开放域对话生成

TL;DR本文研究采用对话行为来模拟人类社交聊天的开放领域对话生成,利用行为策略来管理人机交互流程,并结合强化学习方法对策略进行优化,从而在机器仿真和人机交互中获得了显著响应质量的提升。