BriefGPT.xyz
Ask
alpha
关键词
safe imitation learning
搜索结果 - 1
无限时域可微模型预测控制
本文提出了一种可微分的线性二次模型预测控制(MPC)框架,用于安全模仿学习,其中利用从离散时间代数 Riccati 方程(DARE)获得的终端成本函数强制实施无限地平线成本,以便能够证明所学控制器在闭环中稳定。该框架的学习能力在一组数值研究
→
PDF
5 years ago
Prev
Next