Nov, 2015

基于深度强化学习的战略对话管理

TL;DR本研究成功应用深度强化学习(DRL)训练具备谈判能力的智能策略代理程序,实验表明该程序与由人工设计的规则、随机等算法相比,获胜率提高至53%。