Dec, 2023

PDiT:交错融合感知与决策的 Transformer 用于深度强化学习

TL;DR该研究提出了一种深度强化学习网络,Perception and Decision-making Interleaving Transformer (PDiT),它将两个 Transformer 结合在一起,一个负责环境感知,一个负责决策,并在不同设置中取得了优秀的性能,并提取出可解释的特征表示。