Sep, 2022

实时关注学习模型预测控制器用于现实导航

TL;DR提出一种新的隐式控制策略,即 Performer-MPC,它使用由 Performers 提供的视觉上下文嵌入进行参数化的学习代价函数,并通过联合训练代价函数和构建控制器来有效地解决对应的双层优化问题。与标准 MPC 策略相比,Performer-MPC 在杂乱环境中的目标达成率提高了 40% 以上,在人类环境中的社会指标提高了 65% 以上。