Jun, 2023

Action Q-Transformer:使用动作查询的编码器 - 解码器模型进行深度强化学习的视觉解释

TL;DR本文提出了一种基于 Q-learning 的深度强化学习方法 ——Action Q-Transformer (AQT),它引入了一个 Transformer 编码器 - 解码器结构来实现对代理决策的高度可解释性。我们利用 AQT 在 Atari 游戏任务中实现了代理的决策详细分析,并通过实验结果证明了该方法在某些游戏中可以实现比基线更高的性能。