Mar, 2017
基于神经密度模型的计数探索
Count-Based Exploration with Neural Density Models
Georg Ostrovski, Marc G. Bellemare, Aaron van den Oord, Remi Munos
TL;DR这篇论文研究了在强化学习中,如何使用基于密度模型的伪计数、PixelCNN 等技术进行探索,特别考虑了密度模型对探索的影响,并发现 Monte Carlo 更新在探索中的作用。结果发现结合 PixelCNN 和不同结构的代理可以显著提高在多个难的 Atari 游戏中的性能,当模型假设被违反时,该方法更实用和普适。