Oct, 2023

神经网络结构对于识别时间延长的强化学习任务的影响

TL;DR通过注意力机制构建的强化学习架构在 OpenAI Gym Atari-2600 游戏套件上表现出色,并提供了对代理程序在环境中感知的洞察力。在图像为基础的强化学习领域,我们还提出了一种基于视觉 Transformer 的架构,与以前的方法相比,模型训练速度更快且需要更少的计算资源。