Aug, 2019

基于注意力机制的 Atari 智能体自由午餐显著性

TL;DR本文提出了一种新方法,通过添加自由午餐显著性(FLS)的注意力模块将其应用于深度学习代理在Atari环境中进行的训练,使网络产生注重分布。通过实验,我们发现网络的性能与基线类似,并且可以作为深度强化学习代理的可替代品。