NIPSNov, 2017

高效神经网络对话策略优化中的不确定性估计

TL;DR本文研究了在对话管理环境下,采用深度强化学习框架(DQN)进行不确定性估计的方法,并与常见的基于高斯过程的方法进行了对比和基准测试,并对优化策略进行了探讨。