NIPSNov, 2017
高效神经网络对话策略优化中的不确定性估计
Uncertainty Estimates for Efficient Neural Network-based Dialogue Policy Optimisation
Christopher Tegho, Paweł Budzianowski, Milica Gašić
TL;DR本文研究了在对话管理环境下,采用深度强化学习框架(DQN)进行不确定性估计的方法,并与常见的基于高斯过程的方法进行了对比和基准测试,并对优化策略进行了探讨。