Dec, 2017

高效深度强化学习的多焦点注意力网络

TL;DR本文提出了一种多焦点注意力网络 (Multi-focus Attention Network, MANet) 模型,通过模仿人类对低级感官输入进行空间抽象并同时关注它们的能力,将其分割成若干个部分状态后,利用并行的注意力层关注与任务有关的部分状态进行状态值估计;实验证明,MANet 在体验采样数显著减少的情况下取得了最高分,并相比 Deep Q-network 和单一注意力模型表现更好,同时在多智能体合作任务中,我们的模型比现有最先进模型的学习速度提高了 20%。