- 连续状态空间中的分布可靠随机控制的统计学习
该研究论文介绍了一个分布鲁棒的随机控制范式,能够容纳对分布内可能的自适应敌对扰动的噪声进行考虑,在给定的模糊集合内。通过对两种敌对模型的研究,我们揭示了在不同的动态规划方程下的最优有限样本极小化率,以实现对连续状态下健壮价值函数的统一学习, - 基于数据驱动的带屏障证书容许安全控制
通过使用障碍证明方法,结合高斯过程回归,本文介绍了一种从具备未知动力学的随机系统数据中鉴定出一组最大安全策略的方法。通过学习系统动力学并得到该预估的概率误差,我们开发了一种算法来构建分段随机障碍函数,从而利用学习到的高斯过程模型找到一组最大 - 用于安全控制与学习的近视可验证的概率证书
该论文介绍了一种设计用于随机系统的安全证书的方法,重点是通过快速实时控制来确保长期安全。通过引入一种名为 “概率不变性” 的新颖技术,论文解决了长期安全与计算权衡之间的挑战,并将该技术整合到安全控制和学习中,实现了在随机环境下的长期安全控制 - 基于弱相关回归的利用 Lévy 噪声推断随机动力学
我们提出了一种弱相关回归(WCR)方法,通过回归稀疏线性,基于蒙特卡洛方法的 FP 方程,从离散的聚合数据中揭示包含 α 稳定的 Lévy 噪声和高斯噪声的随机微分方程(SDE)的未知随机动力学系统的。我们的方法能够同时区分混合噪声类型,甚 - 通过贝叶斯神经网络推断具有不确定性的 Langevin 方程
采用贝叶斯神经网络推断随机系统的朗之万方程,以及预测不确定性的综合框架。
- 在主值几何格拉斯曼子流形上的多项式混沌展开用于代理建模与不确定性量化
基于流形学习的替代建模框架,用于高维随机系统的不确定性量化,并利用 Grassmann 流形上的主测地子流形识别潜在参数空间中的不同系统行为。
- FPK 方程在受加性高斯噪声作用下的随机动力学问题的深度学习方法解决方案
这项研究提出了 FPK-DP Net 作为一种将物理洞察力编码到深度神经网络中的物理信息网络,旨在解决高维度的 Fokker-Plank-Kolmogorov 方程,以便在工程系统的分析和应用中提供有价值的见解,并通过在五个不同基准问题上的 - 超出预期:用于随机动力系统的剩余动态模态分解和方差
透过引入方差,我们处理了 Koopman 框架中的一些挑战,从而实现了对随机 Koopman 算子的谱特性的可验证计算,并引入了方差 - 伪谱概念来评估统计一致性。最后,我们利用模拟和实验数据展示了其在神经记录中如何揭示对于标准基于期望的动 - 交互动力系统的深度状态空间模型的廉价和确定性推理
本文提出了一种基于图神经网络的深度状态空间模型,用于建模交互式动态系统,且预测分布为多峰高斯混合模型,同时提出了结构化的协方差近似方法,可以适用于具有多个智能体的系统,并在自动驾驶数据集上进行了测试并与现有技术进行了比较。
- 随机系统中区域稳定控制策略的学习
论文研究了在随机系统中学习控制策略的问题,提出了新的稳定排名超级鞅(sRSMs)概念,并介绍了一个可以学习控制策略和 sRSMs 的学习过程,实验结果表明该过程可以成功地学习稳定性证明策略。
- 在具有不完全可达目标偏好的随机系统中的机会定性规划
本文研究在随机系统中如何综合具有时间扩展目标的偏好满足规划,并提出了安全和积极改进(SPI)和安全几乎肯定改进(SASI)两种解决方案概念以保证改进,并展示了用于合成 SPI 和 SASI 策略的算法。
- 用确定性粒子流约束随机非线性系统
提出了一种非迭代的方法,从一个相互作用粒子逼近的对数梯度中估计必要的控制,用于扰动非线性系统的最优干预。
- 有限时间内的带噪声线性二次调节器的策略梯度方法
本文研究了在线性二次型调节器问题中寻找最优策略的强化学习方法,并在两个例子中说明了该方法的性能。
- AMYTISS:用于大规模随机系统的并行自动控制器合成
本文提出了一种名为 AMYTISS 的软件工具,用于为大规模随机系统设计构造正确控制器。该工具利用高性能计算平台和云计算服务解决了状况膨胀问题,并以几个案例研究来验证了其性能表现。
- 使用前向 - 后向 SDE 学习深度随机最优控制策略
本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究,旨在解决机器人和自主决策问题中的不确定性,并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中,我们研究了所提算法的 - NIPS使用扩散小波的多尺度逆强化学习
本研究提出了一个多尺度框架,用于解决连续时间 / 状态随机系统的逆强化学习问题。通过利用与其相关的马尔可夫链的扩散小波表示来对状态空间进行抽象,此框架可以有效地处理的大型(并且几何复杂)决策空间,同时提供更可解释的演示状态轨迹和逆强化学习策 - 随机系统的鲁棒性灵敏度分析
该研究探讨了一种最坏情况的方法来衡量随机系统性能分析中的模型误差敏感性,通过 Kullback-Leibler(KL)散度度量模型误差,并通过优化计算程序来计算最坏情况性能指标,通过创新的微小近似方法,得出了这些程序的最优值渐近展开式,展开 - 临界转变的数学框架:分叉、快慢系统和随机动力学
论文综述了标准数学理论的应用及其在预测危急转变中所提供的早期预警信号,并通过分析快慢系统的数学理论为关键转变提供了自然定义,进一步结合随机系统研究,提供了潜在的预警信号。
- 游戏指标算法
基于模拟和双模拟的指标可以用于系统验证和性能评估,适用于定量的 mu - 演算和相关概率逻辑,对于马尔可夫链,我们提供了一个 PSPACE 算法,以匹配最佳算法,并且这些算法可以通过二分搜索来逼近指标。
- 非线性收缩理论在离散和混杂随机系统分析中的应用
研究了离散和混合随机非线性动力系统的稳定性质,并将随机收缩定理扩展到离散和混合重置系统的情况。通过这些结果,我们研究了由零散噪声相互作用耦合的噪声非线性振荡器的同步。