Jun, 2024

KalMamba:面向不确定下的高效概率状态空间模型的强化学习

TL;DR提出了 KalMamba—— 一种高效的架构,将概率状态空间模型与确定性状态空间模型的可伸缩性相结合,利用 Mamba 在潜在空间中学习线性高斯状态空间模型的动力学参数,并通过并行关联扫描实现标准卡尔曼滤波和平滑。实验证明,KalMamba 在强化学习中与最先进的 SSM 方法相媲美,同时在计算效率上显著提升,特别是在长时间交互序列中。