Dec, 2016
使用深度循环 Q 学习预测交互环境中注视位置
Learning to predict where to look in interactive environments using deep recurrent q-learning
Sajad Mousavi, Michael Schukat, Enda Howley, Ali Borji, Nasser Mozayani
TL;DR本文利用强化学习和软注意机制结合的 Deep Q-Network 模型教导代理人玩游戏时关注视觉输入的最相关部分,并通过在多个 Atari 2600 游戏上的评估,证明软注意力模型可以比 Itti-Kochs 显著地预测焦点位置。