有条件和驱动过程的变分和最优控制表示

Jun, 2015

有条件和驱动过程的变分和最优控制表示

Variational and optimal control representations of conditioned and driven processes

Raphael Chetrite, Hugo Touchette

TL;DR本文提出一种基于 Doob 的 h 变换的 Markov 过程，并使用大偏差函数和相对熵等原理对其进行了解释和推广，包括控制方法和近似大偏差函数的新方法。

Abstract

We have shown recently that a markov process conditioned on rare events involving time-integrated random variables can be described in the long-time limit by an effective markov process, called the →

markov process driven process large deviation functions relative entropies stochastic control process

发现论文，激发创造

指导点过程的变分策略

本文研究如何为点过程设计最优控制策略，通过最优测度和变分推断的角度来解决随机最优控制问题，并提出了一种凸优化框架和有效的算法来自适应地更新策略，实验表明我们的算法比其他随机控制方法更准确和高效。

Jan, 2017

变分高斯过程扩散过程

本文提出了一种基于连续指数族描述的高斯变分过程的参数化方法，利用凸优化算法来解决具有非线性扩散过程先验的潜在过程的生成模型下的概率推断和学习问题。

Jun, 2023

半 - Markov 过程的动态波动

本文通过发展 Onsager-Machlup 理论来研究非平衡半马尔可夫过程，并确立了一些通用的大偏差结构，研究了驱动方式和非指数等待时间分布对占据时间 - 电流统计变量的影响，并给出了环上随机行走的显式解。

May, 2009

前向 - 后向随机微分方程和可控的麦克汉 - 弗拉索夫动力学

通过概率分析，研究了 McKeanVlasov 型非线性随机动力系统的最优控制问题，给出了最优解的充分条件，并将其应用于含有均场交互的大规模随机博弈中。

Mar, 2013

具有共同噪声和开环控制的均场马尔可夫决策过程

在条件 McKean-Vlasov MDP 模型中，对状态和行动间的平均场作用以及存在公共噪声和无限时间视野下的开环控制的优化进行了详尽的研究。通过间隔最优匹配证明了 CMKV-MDP 与概率测度空间上的一般抬升 MDP 之间的对应，并且通过构建值函数所满足的动态规划 Bellman 定点方程，证明了存在最优的随机反馈控制。

Dec, 2019

离散点过程的快速混合

本文研究用于离散点过程的快速混合马尔可夫链蒙特卡罗采样的系统设计机制，探究了设置条件和误差限制的方法，提出了如何使用 Hessian 量来控制分解信息量，指出如果使用自然的相关性衰减概念，可以使用快速混合的 MCMC 方法导出较小的误差上限。

Jun, 2015

随机微分方程的近似贝叶斯学习

使用高斯过程作为灵活的模型并使用高斯过程回归直接从稠密数据集中计算估计，开发出一种非参数方法来估计随机微分方程组中的漂移和扩散函数，并开发了一种近似的期望最大化算法来处理稀疏观察之间的未观察到的潜在动态。

Feb, 2017

神经马尔可夫跳进程

本文提出了一种基于神经常微分方程的变分推断算法，在 Markov 跳跃过程中通过学习神经连续时间表示来近似后验分布，相比于 Monte Carlo 和期望最大化方法具有更高效的性能。

May, 2023

风险敏感的 Markov 控制过程

本文提出了一种广义风险测量的框架，应用加权规范空间研究了马尔科夫控制过程中的风险敏感性优化问题，并提出了新的贴现方案和 Lyapunov 稳定性条件。

Oct, 2011

连续时间随机过程的期望传播

通过 Bayesian 框架和变分近似推断将离散时间观察和连续时间约束转化为在扩散过程的轨迹上的后验测量逆问题，同时使用化学朗之万方程将此逼近推广到广泛的离散状态马尔可夫跳跃过程中，取得了计算效率高和逆问题的较好逼近的实验结果。

Dec, 2015