复杂随机过程的易处理推理

Jan, 2013

Tractable Inference for Complex Stochastic Processes

Xavier Boyen, Daphne Koller

TL;DR本文描述了在动态贝叶斯网络中维护精简的信任状态的想法，以及分析错误是如何随过程演化呈指数级收缩的，最终向我们展示了如何在监测任务中应用我们的想法。

Abstract

The monitoring and control of any dynamic system depends crucially on the ability to reason about its current status and its future trajectory. In the case of a stochastic system, these tasks typically involve th

stochastic system belief state dynamic bayesian networks approximation scheme monitoring

发现论文，激发创造

利用因果关系在动态贝叶斯网络中进行选择性信念过滤（扩展摘要）

该研究探索了利用因果关系加速贝叶斯网络中的信念过滤任务的想法，并提出了一种基于被动性的选择性信念过滤方法（PSBF），该方法在维护因果关系的情况下，在虚拟进程和模拟多机器人仓库中均优于传统滤波方法。

Jul, 2019

通过正式抽象实现非高斯噪声动态系统的鲁棒控制

该研究论文提出了一种新颖的控制器合成方法，它不需要任何明确表示噪声分布的方式，而是通过将控制系统抽象为捕捉噪声的有限状态模型，然后使用从场景方法中的工具来计算可能正确的限制，基于一些噪声的有限数量样本。通过缩小合成过程的复杂性，该方法在实际控制系统上的应用具有广泛的适用性。

Jan, 2023

随机微分方程的近似贝叶斯学习

使用高斯过程作为灵活的模型并使用高斯过程回归直接从稠密数据集中计算估计，开发出一种非参数方法来估计随机微分方程组中的漂移和扩散函数，并开发了一种近似的期望最大化算法来处理稀疏观察之间的未观察到的潜在动态。

Feb, 2017

不确定系统最劣控制与学习的近似信息状态

本文研究了在部分观测状态的不确定系统中的离散决策问题，并通过开发信息状态和近似信息状态的概念，提出了一个可行的决策框架。我们使用这一概念定义了近似动态规划，通过输出数据进行学习，以达到有界性能的策略，最后提供了数值实验来说明这一结果在控制和强化学习中的应用。

Jan, 2023

无限时间视角下基于部分观测的最坏情况控制与学习

本文研究了安全关键的物理系统所需的控制策略，通过建模系统中的不确定性和模型干扰，提出了一种近似控制和学习框架，并对其进行了数学分析和算法设计。

Mar, 2023

连续时间随机过程的期望传播

通过 Bayesian 框架和变分近似推断将离散时间观察和连续时间约束转化为在扩散过程的轨迹上的后验测量逆问题，同时使用化学朗之万方程将此逼近推广到广泛的离散状态马尔可夫跳跃过程中，取得了计算效率高和逆问题的较好逼近的实验结果。

Dec, 2015

计数无限状态空间马尔可夫决策过程的贝叶斯学习最优策略

该研究提出了一种基于贝叶斯思想和汤普森抽样的算法来解决优化数量可数的马尔可夫决策过程的控制问题，在未知参数和固定先验分布的情况下，能够稳定地获得近似最优解，适用于诸如通信网络和计算系统等不确定动力系统以及一些数量可数的排队模型。

Jun, 2023

间歇可观察的马尔科夫决策过程

本文研究了在不稳定状态信息下的 MDP，提出了一种基于树组织结构和值迭代算法的有限状态近似方法来寻找最优策略。

Feb, 2023

基于形式抽象的随机和不确定动态模型自动构造控制

自动化合成控制器，基于概率时间逻辑规范的随机动态模型，通过状态验证技术构建的 iMDP（带概率区间的马尔科夫决策过程），解决安全关键场景中面临的挑战。

Nov, 2023

带时钟的连续时间贝叶斯网络

本文提出一种基于时钟机制的连续时间贝叶斯网络模型，实现了对指数存活时间约束的突破，从而改善了概率计算效率，并通过基因调节网络的数据集进行了实验验证。

Jul, 2020