Dec, 2018

Wasserstein 分布稳健随机控制:一种数据驱动的方法

TL;DR研究了一个基于 Wasserstein 分布的鲁棒控制策略问题,提出了一个可计算的值迭代算法和策略迭代算法,并通过动态规划和 Kantorovich 对偶理论的分析,在保证置信水平不降低的情况下,构造了一个多阶段性能保证和最优分布鲁棒控制策略。