Mar, 2024

LQR 元策略估计的 Moreau 包络方法

TL;DR基于不确定动态系统的有限实现集,我们提出了一种基于 Moreau 包络的代理 LQR 成本方法,以定义一种能够高效适应新实现的元策略,并设计了一种算法来寻找元 LQR 成本函数的近似一阶稳定点。数值结果表明,所提出的方法在新的线性系统实现上优于简单平均控制器。我们还提供了经验证据表明,我们的方法具有比模型无关元学习(MAML)方法更好的样本复杂度。