Sep, 2021

基于鲁棒管模型预测控制的演示高效引导策略搜索

TL;DR本文通过引入深度神经网络和模仿学习,提出了一种高效的方法来将计算成本昂贵的模型预测控制器(MPC)压缩成更高效的表示,首次提出了Robust Tube variant(RTMPC)和数据增强方法来弥补通常在模仿学习中遇到的分布偏移问题,并通过数值和实验评估表明,相对于常用的仿真方法,如DAgger和域拓扑,我们的方法在演示效率和对训练期间未见过的扰动的抗干扰性方面表现更好。