实时关注学习模型预测控制器用于现实导航

Sep, 2022

实时关注学习模型预测控制器用于现实导航

Learning Model Predictive Controllers with Real-Time Attention for Real-World Navigation

Xuesu Xiao, Tingnan Zhang, Krzysztof Choromanski, Edward Lee, Anthony Francis...

TL;DR提出一种新的隐式控制策略，即 Performer-MPC，它使用由 Performers 提供的视觉上下文嵌入进行参数化的学习代价函数，并通过联合训练代价函数和构建控制器来有效地解决对应的双层优化问题。与标准 MPC 策略相比，Performer-MPC 在杂乱环境中的目标达成率提高了 40% 以上，在人类环境中的社会指标提高了 65% 以上。

Abstract

Despite decades of research, existing navigation systems still face real-world challenges when deployed in the wild, e.g., in cluttered home environments or in human-occupied public spaces. To address this, we present a new class of →

navigation systems implicit control policies imitation learning model predictive control performers

发现论文，激发创造

基于 MPC 引导的策略搜索学习自主飞行器深度控制策略

模型预测控制与强化学习相结合并在引导策略搜索框架下应用，通过使用机载传感器数据在训练时间内训练神经网络策略，该策略可成功地控制四旋翼飞行器的避障而无需系统完整状态知识。

Sep, 2015

GAN-MPC: 使用来源于不同专家的演示训练参数化成本函数的模型预测控制器

使用对抗生成网络的学习型 MPC 策略可以通过模仿学习来解决某些困难的 MPC 优化问题，特别是当展示代理和模仿代理不重叠时。

May, 2023

使用管道 Model Predictive Control 引导的数据增强，高效学习鲁棒性和适应性策略的深度学习

本文介绍了一种有效的基于模型预测控制的自适应方法，用于在具有挑战性的非结构化环境中实现自主系统的运行控制，以适应多样的环境和模型不确定性。

Mar, 2023

深度交互式动作预测与规划：通过动作预测模型进行游戏

本研究提出一种多智能体策略网络和博弈论模型预测控制器相结合的方案，将自动驾驶车辆的预测和规划层紧密耦合，能够有效生成交互行为。

Apr, 2022

自适应世界模型的自动驾驶规划

模型预测控制基于 BehaviorNet 的 AdaptiveDriver 在 nuPlan 闭环规划基准中取得了最先进的结果，将测试误差从 6.4％降低到 4.6％，即使应用于以前未见的城市。

Jun, 2024

针对连续控制评估基于模型的规划和规划器分摊

本文探讨了基于模型的控制方法是否能够超越基于数据的方法。研究人员通过将模型预测控制与学习模型和基于数据的策略学习相结合的方式，对多种具有挑战性的运动任务进行了评估，并发现：经过良好调节的基于数据的策略学习代理是高自由度控制问题的强基准。但是，针对困难的多任务 / 多目标场景，经过训练的动态模型和学习的策略作为模型预测控制的建议，可以显著提高性能和数据效率。最后，研究表明，即使没有性能损失，也可以将基于模型的规划器简化为一种策略，从而将计划计算的负担分担到了策略中。

Oct, 2021

应用 MPC - 强化学习方法的无人机路径规划考虑避障

本文提出一种基于深度学习算法的无人机航迹规划方法，采用 LSTM-MPC 作为决策策略，并结合预测池来提高系统鲁棒性和效率，同时通过数值仿真实验验证了该方法的有效性。

Feb, 2023

PLATO: 使用自适应轨迹优化的策略学习

PLATO 算法通过模型预测控制生成监督信号训练控制策略，以逐步匹配学到的策略，并保证其安全性，同时维持模型预测控制的成本作为约束，使最终学到的策略在长时间任务中表现良好。实验结果表明，PLATO 算法相较于先前方法，学习速度更快，在训练过程中遇到灾难性失败（坠机）的次数大幅减少，更可能收敛到较好的策略。

Mar, 2016

滤波感知模型预测控制

本文采用滤波器感知的模型预测控制方法，既考虑了不确定性的影响，又可以通过建立一个包含感知能力的模型来显著提高控制性能。

Apr, 2023

移动目标的学习控制策略主动分类

本文提出了一种基于注意力机制的强化学习架构，通过计算控制输入，移动无人机到最优视角收集多个运动目标的语义信息，填补了 ' 黑匣子 ' 分类器无法对视角和输出建立分析关系的巨大空白。结果显示，该算法不仅优于多个基线算法，而且在未见过训练场景的情况下也具有泛化能力。

Dec, 2022