May, 2024

Mamba 在离线强化学习中是否与轨迹优化兼容?

TL;DR本研究目的是通过全面的实验,从数据结构和网络架构的角度探索决策 Mamba 在离线强化学习中的潜力,证明它与轨迹优化的兼容性,并超越了以往最先进的方法。