Sep, 2023

梯度为基础的 MAML 在 LQR 中的收敛性

TL;DR本研究探讨了 Model-agnostic Meta-learning (MAML) 在线性系统二次最优控制(LQR)中的局部收敛特性,同时保持动态系统的稳定性。通过简单的数值结果展示了 MAML 在 LQR 任务中的收敛性。