Dec, 2016

使用深度循环 Q 学习预测交互环境中注视位置

TL;DR本文利用强化学习和软注意机制结合的 Deep Q-Network 模型教导代理人玩游戏时关注视觉输入的最相关部分,并通过在多个 Atari 2600 游戏上的评估,证明软注意力模型可以比 Itti-Kochs 显著地预测焦点位置。