Mar, 2017

基于神经密度模型的计数探索

TL;DR这篇论文研究了在强化学习中,如何使用基于密度模型的伪计数、PixelCNN 等技术进行探索,特别考虑了密度模型对探索的影响,并发现 Monte Carlo 更新在探索中的作用。结果发现结合 PixelCNN 和不同结构的代理可以显著提高在多个难的 Atari 游戏中的性能,当模型假设被违反时,该方法更实用和普适。