Apr, 2023

使用 Wasserstein 距离的分布鲁棒方法实现遗憾最优控制

TL;DR本文提出了一种基于分布鲁棒性的方法来控制线性离散动态系统,在随机加性干扰作用下具有二次成本。假设干扰过程的基础概率分布为未知的,但被认为位于给定的分布半径球中,用 Wasserstein 距离求得。在此框架中,设计了严格因果线性干扰反馈控制器来最小化最坏情况下期望遗憾。通过对最优运输问题的对偶理论建立,可将此遗憾最小化控制问题重新等价为一个可行的半定编程问题。该等效对偶公式还允许我们确定中心分布与最坏情况下分布之间的最坏情况下期望遗憾。