SIXO: 扭曲目标平滑推断

Jun, 2022

SIXO: Smoothing Inference with Twisted Objectives

Dieterich Lawson, Allan Raventós, Andrew Warrington, Scott Linderman

TL;DRSIXO 是一种结合了密度比估计和 SMC 算法的方法，用于学习逼近平滑分布的目标分布，从而在状态空间模型的推断和模型学习中获得更准确的后验推断和参数估计结果。

Abstract

sequential monte carlo (SMC) is an inference algorithm for state space models that approximates the posterior by sampling from a sequence of target distributions. The target distributions are often chosen to be t

sequential monte carlo state space models sixo smoothing distributions density ratio estimation

发现论文，激发创造

使用顺序蒙特卡罗法进行前向平滑

本文提出了一种基于前向滤波后向平滑算法的在线或正向递归计算附加功能期望值的 SMC 算法，相较于标准路径空间 SMC 估计量，该估计量的渐近方差只会线性增加，可以实现不会受到粒子路径退化问题的在线最大似然参数估计算法。

Dec, 2010

SMC^2: 一种用于状态空间模型顺序分析的高效算法

本文提出了一种应用于状态空间模型的序贝叶斯推断算法 ——SMC^2 算法，它将粒子滤波器和粒子马尔可夫链蒙特卡洛方法相结合，在 θ 维度上进行粒子重要性采样，并通过重新采样步骤和 MCMC 更新步骤来更新粒子，从而解决了状态空间内，用常规方式无法计算出的条件概率密度增量。

Jan, 2011

评论家顺序蒙特卡罗

本文介绍了 CriticSMC 算法，结合学习的 Soft-Q 函数启发式因子实现了一种规划为推理的算法。实验表明该算法在高维仿真驾驶任务中显著降低了碰撞率，同时保持了较高的计算效率和真实性。

May, 2022

扭曲序列蒙特卡罗在语言模型中的概率推理

本论文介绍了大型语言模型的能力和安全技术，其中包括强化式高阶采样、自动红队测试、提示工程和填充等，并使用序贯蒙特卡罗方法解决这些概率推理问题。我们提出了一种学习扭曲函数的对比方法，并将其与软强化学习的丰富文献进行了联系。此外，我们还应用了扭曲的序贯蒙特卡罗框架进行推理评估，并展示了它在预训练模型样本采样、生成具有不同情感的评论以及填充任务中的有效性。

Apr, 2024

图形模型的顺序蒙特卡罗方法

通过提出一种新的框架，使用顺序蒙特卡罗方法对概率图模型进行推断，其目的是通过针对辅助分布来逼近概率图模型定义的全联合分布，并用于构建一般 PGM 的高维块采样算法。

Feb, 2014

在线变分顺序蒙特卡洛

在该研究中，我们使用基于粒子方法和变分推断的变分序贯蒙特卡洛（VSMC）方法，在时间上分布了 VSMC 代理 ELBO 的梯度的近似，从而实现了面向数据流的在线学习，能够高效地进行参数估计和粒子提议适应。同时，我们提供了与数据量趋于无穷大时该算法收敛性质的严格理论结果，以及在批处理设置中的出色收敛性和实用性的数值说明。

Dec, 2023

变分序贯蒙特卡罗

本文在变分推理中提出了一种新的逼近分布族：变分顺序蒙特卡罗（VSMC）族，并显示了如何在变分推理中优化它，从而将变分推理和顺序蒙特卡罗相结合，提供了灵活，准确且强大的贝叶斯推理。我们展示了它在状态空间模型，金融数据随机波动模型以及大脑神经电路的深度马尔可夫模型上的实用性。

May, 2017

神经自适应序贯蒙特卡罗

本文介绍了一种新的适应性 SMD 方法，该方法使用了 Kullback-Leibler 散度的近似来自动适应提议分布，该方法非常灵活，适用于任何参数化的提议分布，并支持在线和批处理变量，我们使用新框架来适应基于神经网络的强大提议分布，从而导致神经自适应序贯蒙特卡洛，实验表明，在非线性状态空间模型中，NASMC 显着改善了推断，优于自适应提议方法，包括扩展卡尔曼和无味粒子滤波器，也表明当 NASMC 用作粒子分辨率 Metropolis　Hastings 的子程序时，改进的推断可转化为参数学习的改进。最后，我们展示 NASMC 能够训练潜在变量递归神经网络（LV-RNN），达到与多态音乐建模的最新水平竞争的结果。NASMC 可以看作是将自适应 SMC 方法与最近的可扩展的黑箱变分推理工作之间的桥梁。

Jun, 2015

加权样本的极限定理及其在顺序蒙特卡罗方法中的应用

本文针对顺序蒙特卡罗方法进行了渐近分析，建立了大数定理和不变原理。作者引入 “加权样本” 一致性和渐近正态性的概念，并导出了构建顺序蒙特卡罗方法中用到的突变和选择过程保留这些属性的条件。作者分析了应用于状态空间模型中的 SMC 算法，展示了如何使用所提出的技术来放松之前报告的工作中使用的技术条件，并提供分析更复杂的序列抽样策略的基础。

Jul, 2005

高维顺序蒙特卡罗方法的稳定性

研究了在高维问题中，应用序贯蒙特卡洛方法进行采样时普遍出现的效率低下的问题。针对这一问题，提出了使用一系列人工目标密度，通过序贯蒙特卡洛方法进行采样，可用固定数量样本的 SMC 类方法得到精度随维度增加而不降的分布近似，并且引入重采样可以进一步提高重要性权重的可变性，降低蒙特卡洛误差。

Mar, 2011