BriefGPT.xyz
Ask
alpha
关键词
robust control policy
搜索结果 - 2
Wasserstein 分布稳健随机控制:一种数据驱动的方法
研究了一个基于 Wasserstein 分布的鲁棒控制策略问题,提出了一个可计算的值迭代算法和策略迭代算法,并通过动态规划和 Kantorovich 对偶理论的分析,在保证置信水平不降低的情况下,构造了一个多阶段性能保证和最优分布鲁棒控制策
→
PDF
6 years ago
面向未知预测:基于在线系统认知学习通用策略
通过利用物理模拟器生成的大量训练样本,我们提出了一种新的学习控制策略的方法,该方法可以成功地在未知的动态模型下运行。我们的系统由通用策略(UP)和在线系统识别(OSI)函数两部分组成,通过 UP 的训练和在系统状态下提供的来自 OSI 的
→
PDF
7 years ago
Prev
Next