该研究探索了利用因果关系加速贝叶斯网络中的信念过滤任务的想法,并提出了一种基于被动性的选择性信念过滤方法(PSBF),该方法在维护因果关系的情况下,在虚拟进程和模拟多机器人仓库中均优于传统滤波方法。
Jul, 2019
该研究论文提出了一种新颖的控制器合成方法,它不需要任何明确表示噪声分布的方式,而是通过将控制系统抽象为捕捉噪声的有限状态模型,然后使用从场景方法中的工具来计算可能正确的限制,基于一些噪声的有限数量样本。通过缩小合成过程的复杂性,该方法在实际控制系统上的应用具有广泛的适用性。
Jan, 2023
使用高斯过程作为灵活的模型并使用高斯过程回归直接从稠密数据集中计算估计,开发出一种非参数方法来估计随机微分方程组中的漂移和扩散函数,并开发了一种近似的期望最大化算法来处理稀疏观察之间的未观察到的潜在动态。
Feb, 2017
本文研究了在部分观测状态的不确定系统中的离散决策问题,并通过开发信息状态和近似信息状态的概念,提出了一个可行的决策框架。我们使用这一概念定义了近似动态规划,通过输出数据进行学习,以达到有界性能的策略,最后提供了数值实验来说明这一结果在控制和强化学习中的应用。
本文研究了安全关键的物理系统所需的控制策略,通过建模系统中的不确定性和模型干扰,提出了一种近似控制和学习框架,并对其进行了数学分析和算法设计。
Mar, 2023
通过 Bayesian 框架和变分近似推断将离散时间观察和连续时间约束转化为在扩散过程的轨迹上的后验测量逆问题,同时使用化学朗之万方程将此逼近推广到广泛的离散状态马尔可夫跳跃过程中,取得了计算效率高和逆问题的较好逼近的实验结果。
Dec, 2015
该研究提出了一种基于贝叶斯思想和汤普森抽样的算法来解决优化数量可数的马尔可夫决策过程的控制问题,在未知参数和固定先验分布的情况下,能够稳定地获得近似最优解,适用于诸如通信网络和计算系统等不确定动力系统以及一些数量可数的排队模型。
Jun, 2023
本文研究了在不稳定状态信息下的 MDP,提出了一种基于树组织结构和值迭代算法的有限状态近似方法来寻找最优策略。
Feb, 2023
自动化合成控制器,基于概率时间逻辑规范的随机动态模型,通过状态验证技术构建的 iMDP(带概率区间的马尔科夫决策过程),解决安全关键场景中面临的挑战。
Nov, 2023
本文提出一种基于时钟机制的连续时间贝叶斯网络模型,实现了对指数存活时间约束的突破,从而改善了概率计算效率,并通过基因调节网络的数据集进行了实验验证。
Jul, 2020