ICMLNov, 2019

高效探索的隐式生成模型

TL;DR本文介绍了一种基于模型不确定性估计的机制,通过引入基于贝叶斯不确定性的内在奖励来提高强化学习中的探索效率,并将隐式的生成建模方法用于训练。实验结果表明,与其他探索方法相比,该算法在提高数据效率方面表现出色。