May, 2024

可微粒子滤波器的策略学习

TL;DR本文介绍了一种基于神经网络的可微分粒子滤波器 (RLPF) 来解决在系统可能在有限集合的状态空间模型之间切换的情况下同时学习各个模型及切换过程的问题,并提出了相应的训练方法。通过数值实验,我们证明了与先前最先进的算法相比,RLPF 取得了有竞争力的性能。