透过连续粒子滤波在循环神经网络中进行隐状态近似

Dec, 2022

透过连续粒子滤波在循环神经网络中进行隐状态近似

Hidden State Approximation in Recurrent Neural Networks Using Continuous Particle Filtering

Dexun Li

TL;DR本文介绍一种基于历史数据，使用逐步加粗的粒子来近似表示潜在状态分布的序列预测模型，利用连续可微分的方案，根据贝叶斯规则，自适应提取有价值的信息和更新潜在状态，并在预测任务中取得了良好的效果。

Abstract

Using historical data to predict future events has many applications in the real world, such as stock price prediction; the robot localization. In the past decades, the convolutional long short-term memory (LSTM)

historical data convolutional long short-term memory encoder-decoder mechanism bayes rule prediction tasks

发现论文，激发创造

粒子滤波循环神经网络

本研究介绍了一种新的递归神经网络的方法，即基于粒子滤波的递归神经网络，它将不确定性建模为一组粒子，并提出了一种全可微分的粒子滤波算法来更新其内部状态分布，实验证明该方法在真实世界序列预测方面优于标准门控递归神经网络。

May, 2019

基于粒子流的循环神经网络用于概率时空预测

采用基于粒子流的贝叶斯推理方法，通过状态空间模型实现时间序列预测以及不确定性分析，比当前点预测方法提供更好的不确定性特征与相似的预测准确性。

Jun, 2021

学习非规则采样时间序列中的长期依赖

我们提出了一种基于长短期记忆机制的算法来解决非均匀采样数据上具有长期依赖性的序列建模问题，其核心是将记忆从时间连续状态中分离出来，形成了一种新的 ODE-LSTM 模型。实验证明，该模型在非均匀采样数据的长期依赖建模上优于基于其他递归神经网络的模型。

Jun, 2020

短期交通流量预测的混合隐马尔可夫 LSTM 模型

这篇研究提出了一种混合隐藏马尔可夫 - LSTM 模型，用于交通流预测，相比于传统方法，如 Markov 切换 ARIMA 和 LSTM，该模型具有显着的性能提升。

Jul, 2023

利用隐马尔科夫模型提高循环神经网络的可解释性

通过将循环神经网络与隐马尔科夫模型相结合，旨在增加其可解释性，发现 LSTM 和 HMM 可以学习互补的文本特征信息。

Jun, 2016

使用隐马尔可夫模型提高循环神经网络的可解释性

本文介绍了一种利用长短时记忆模型和隐马尔科夫模型相结合的方法来提高循环神经网络的可解释性的途径，并在文本数据和医疗时间序列数据上测试了该算法，发现 LSTM 和 HMM 学习文本特征的信息互为补充。

Nov, 2016

理解循环神经网络中的隐藏记忆

本文提出了一种基于可视化分析的方法，通过理解和比较用于自然语言处理的循环神经网络模型，包括基于各个隐藏状态单元对输入文本的响应和相似性进行聚类和可视化，以及通过基于聚合信息的图标序列可视化分析 RNN 的隐藏状态的行为，实验结果表明该方法在领域专家的案例研究和评论中具有可用性和有效性。

Oct, 2017

用神经粒子平滑法从条件序列模型中进行采样

本文介绍了神经粒子平滑法，一种用于从给定概率模型中采样输入字符串注释的顺序蒙特卡罗方法，通过训练向前看的 LSTM 来改进样本的质量，同时解释了神经模型和神经采样器可被视为处理非常大状态空间上的 HMM 时的低维非线性逼近。

Apr, 2018

预测状态循环神经网络

我们提出了一种新的模型，Predictive State Recurrent Neural Networks (PSRNNs)，用于过滤和预测动态系统中的信息。我们使用了循环神经网络 (RNNs) 和预测状态表示 (PSRs) 的见解，并继承了这两种模型的优势。我们表明，我们的模型可以通过联合反向传播算法和基于统计一致性的学习算法 Two-Stage Regression (2SR) 的初始化来有效地学习和因数分解模型大小，以减少模型计算时间和提高模型性能。通过实验，我们证明了在所有情况下，PSRNNs 比其他常见的动态系统建模方法都有更好的表现。

May, 2017

内存高效的粒子滤波循环神经网络用于目标定位

该研究提出了一种新颖的内存高效的循环神经网络（RNN）架构，用于解决目标定位问题，并通过将经典的粒子滤波器与 GRU RNN 架构相结合，提出了构建粒子滤波器 RNN 模型（mePFRNN）的关键特性是在处理不同尺寸环境时所需的参数数目相同。因此，相比于先前提出的 PFRNN 模型，该提议的 mePFRNN 架构消耗更少的存储参数内存。通过在对称且嘈杂的环境中进行测试，以展示我们模型的性能，实验结果表明，相比于其他考虑的竞争者，mePFRNN 模型具有更精确的定位结果，并且需要更少的训练参数。

Oct, 2023