Jul, 2019

多视角环境下深度强化学习的演员-评论家-注意力机制

TL;DR本文提出了一种基于深度强化学习和注意力机制的多视角环境下的模型,能够学习一个能够根据每个视角的重要性来动态决策的策略,实验结果表明在各种复杂环境中都表现出色。