Jun, 2024

蝰蛇作为决策者:探索离线强化学习中的多尺度序列建模

TL;DR该研究论文借助于 Mamba Decision Maker 对 RL 领域的序列建模能力进行了深入探讨,并为未来鲁棒高效决策系统的进一步发展铺平了道路。