Dec, 2023
PDiT:交错融合感知与决策的 Transformer 用于深度强化学习
PDiT: Interleaving Perception and Decision-making Transformers for Deep Reinforcement Learning
Hangyu Mao, Rui Zhao, Ziyue Li, Zhiwei Xu, Hao Chen...
TL;DR该研究提出了一种深度强化学习网络,Perception and Decision-making Interleaving Transformer (PDiT),它将两个 Transformer 结合在一起,一个负责环境感知,一个负责决策,并在不同设置中取得了优秀的性能,并提取出可解释的特征表示。