有条件和驱动过程的变分和最优控制表示
本文研究如何为点过程设计最优控制策略,通过最优测度和变分推断的角度来解决随机最优控制问题,并提出了一种凸优化框架和有效的算法来自适应地更新策略,实验表明我们的算法比其他随机控制方法更准确和高效。
Jan, 2017
本文通过发展 Onsager-Machlup 理论来研究非平衡半马尔可夫过程,并确立了一些通用的大偏差结构,研究了驱动方式和非指数等待时间分布对占据时间 - 电流统计变量的影响,并给出了环上随机行走的显式解。
May, 2009
通过概率分析,研究了 McKeanVlasov 型非线性随机动力系统的最优控制问题,给出了最优解的充分条件,并将其应用于含有均场交互的大规模随机博弈中。
Mar, 2013
在条件 McKean-Vlasov MDP 模型中,对状态和行动间的平均场作用以及存在公共噪声和无限时间视野下的开环控制的优化进行了详尽的研究。通过间隔最优匹配证明了 CMKV-MDP 与概率测度空间上的一般抬升 MDP 之间的对应,并且通过构建值函数所满足的动态规划 Bellman 定点方程,证明了存在最优的随机反馈控制。
Dec, 2019
本文研究用于离散点过程的快速混合马尔可夫链蒙特卡罗采样的系统设计机制,探究了设置条件和误差限制的方法,提出了如何使用 Hessian 量来控制分解信息量,指出如果使用自然的相关性衰减概念,可以使用快速混合的 MCMC 方法导出较小的误差上限。
Jun, 2015
使用高斯过程作为灵活的模型并使用高斯过程回归直接从稠密数据集中计算估计,开发出一种非参数方法来估计随机微分方程组中的漂移和扩散函数,并开发了一种近似的期望最大化算法来处理稀疏观察之间的未观察到的潜在动态。
Feb, 2017
本文提出了一种基于神经常微分方程的变分推断算法,在 Markov 跳跃过程中通过学习神经连续时间表示来近似后验分布,相比于 Monte Carlo 和期望最大化方法具有更高效的性能。
May, 2023
本文提出了一种广义风险测量的框架,应用加权规范空间研究了马尔科夫控制过程中的风险敏感性优化问题,并提出了新的贴现方案和 Lyapunov 稳定性条件。
Oct, 2011
通过 Bayesian 框架和变分近似推断将离散时间观察和连续时间约束转化为在扩散过程的轨迹上的后验测量逆问题,同时使用化学朗之万方程将此逼近推广到广泛的离散状态马尔可夫跳跃过程中,取得了计算效率高和逆问题的较好逼近的实验结果。
Dec, 2015