可微粒子滤波器的策略学习

May, 2024

Regime Learning for Differentiable Particle Filters

John-Joseph Brady, Yuhui Luo, Wenwu Wang, Victor Elvira, Yunpeng Li

TL;DR本文介绍了一种基于神经网络的可微分粒子滤波器 (RLPF) 来解决在系统可能在有限集合的状态空间模型之间切换的情况下同时学习各个模型及切换过程的问题，并提出了相应的训练方法。通过数值实验，我们证明了与先前最先进的算法相比，RLPF 取得了有竞争力的性能。

Abstract

differentiable particle filters are an emerging class of models that combine sequential Monte Carlo techniques with the flexibility of neural networks to perform →

differentiable particle filters neural networks state space inference regime learning switching process

发现论文，激发创造

现场学习可微分粒子滤波

本文提出了一种可微粒子滤波器的在线学习框架，通过采用无监督损失来构建在线模型更新过程，实现随着数据的到达更新模型参数；通过在模拟设置中进行实证评估，并与监督学习方法进行比较，包括多元线性高斯状态空间模型和模拟物体跟踪实验。

Dec, 2023

可微粒子滤波器概述：数据自适应序贝叶斯推断

本文综述了近年来不同的可微粒子滤波器及其应用，重点介绍了其中的关键组件设计，包括动态模型、测量模型、提议分布、优化目标和可微重采样技术。

Feb, 2023

可微粒子滤波器：通过算法先验进行端到端学习

本研究介绍了可微分粒子滤波器（DPFs），用于在概率分布之上进行的递归状态估计的算法。我们证明了不同的学习模型如动态和测量模型，能在 end-to-end 的不同 iable 框架下完成。当前的实验表明，与 LSTM 相比，DPFs 能够更好地维持位置估计并能提高算法的泛化性。

May, 2018

基于可微粒子滤波器的正规化流

该研究使用 (条件) 归一化流构建动态模型、提议分布和测量模型，提出了一种不同 iable 粒子滤波框架，并通过一系列数值实验评估了该方法的性能。

Mar, 2024

粒子滤波循环神经网络

本研究介绍了一种新的递归神经网络的方法，即基于粒子滤波的递归神经网络，它将不确定性建模为一组粒子，并提出了一种全可微分的粒子滤波算法来更新其内部状态分布，实验证明该方法在真实世界序列预测方面优于标准门控递归神经网络。

May, 2019

重审可微分粒子滤波器的半监督训练目标

本文比较了两种半监督训练目标对可微粒子滤波器的有效性，并在两个模拟环境中展示了标记数据稀缺的结果。

May, 2024

如何训练可微分滤波器

本文研究不同类型的过滤算法，特别是可微分的过滤算法对于机器人应用中基于状态估计的决策制定和任务执行的优势，并比较了这些不同方法的表现。

Dec, 2020

实现可微重采样

通过引入一个基于神经网络的重采样器，以取代传统的重采样，我们解决了对可微分粒子滤波器的挑战，我们展示了一个新颖的网络体系结构，粒子变换器，并使用基于可能性的粒子集合的损失函数训练了它，我们的结果表明，我们的学习重采样器在合成数据和模拟机器人定位任务上优于传统的重采样技术。

Apr, 2020

利用最优放置重采样的可微粒子滤波

提出了一种可微分的重采样方案，通过从经验累积分布函数进行确定性采样，用于粒子滤波器的参数推断和提议学习任务。

Feb, 2024

针对复杂部分观测的判别式粒子滤波强化学习

本文提出了一种新的强化学习框架 DPFRL，它采用区分性粒子滤波器来进行对复杂部分观察的明确推理，同时在决策中使用学习的区分性更新方法，提高了性能并解决了复杂观测建模的难题，提出的基于矩函数的信念特征在 Flickering Atari Games 和 Habitat 环境实验中有较好的表现。

Feb, 2020