- LeTac-MPC:学习型模型预测控制在触觉反应抓取中的应用
LeTac-MPC 是一种基于学习的模型预测控制(MPC)方法,通过利用视觉基于触觉传感器 GelSight 的高分辨率触觉反馈,实现了对不同物体物理特性的动态和力交互任务中的稳健抓取控制。
- DeepForge:通过模型预测控制在金属成形中利用人工智能进行微结构控制
本研究介绍了一种结合模型预测控制(MPC)和深度锻造(DeepForge)机器学习模型的封闭模具热锻微结构控制的新方法。DeepForge 利用包含 1D 卷积神经网络和门控循环单元的体系结构,利用工件表面温度测量值作为输入来预测锻造过程中 - 基于数据 / 时刻驱动的集体动力学快速预测控制方法
大规模粒子系统的反馈控制合成在模型预测控制(MPC)框架内进行回顾。集体动力学的高维特性阻碍了传统 MPC 算法的性能,该算法基于每个时间步的快速在线动态优化。提出了两种 MPC 的替代方案。首先,讨论了使用监督学习技术对最优反馈定律进行离 - FIDLAR:用于洪灾缓解的预测引导深度学习架构
在沿海河流系统中,通过使用诸如水坝、闸门、泵和水库等水力结构,以预测前释放水来减轻或甚至预防在暴风雨或大潮期间频繁发生的洪水,可以在很大程度上降低生命和财产的威胁。本文提出了一种名为 FIDLAR 的预测通知深度学习架构,用于实现快速和最优 - 非线性系统的安全保证探索
使用最优控制提出新的安全保证的探索框架,其中包括对于非线性系统的有限时间样本复杂度边界下的保证的探索,具有任意高概率的可靠性和安全性,在复杂的非线性动态和未知领域的许多实际情景中具备一般性和适用性。
- 一种基于安全强化学习的权重变化模型预测控制方法用于自动驾驶车辆运动控制
基于深度强化学习的多目标贝叶斯优化模型预测控制中,在运行过程中,通过限制强化学习动作空间在安全学习空间内,选择最优离散动作,并根据上下文选择相应的优化权重集合,使得未经训练的强化学习模型表现出安全且最优的性能,实验结果表明,训练后的模型展现 - 商业建筑需求响应的高效数据驱动型 MPC
基于模型预测控制 (MPC) 的能源管理方法,通过数据驱动的途径和混合整数凸优化算法,实现对建筑物的热力学建模和需求响应,从而提高热舒适度、降低能耗和成本。
- Proto-MPC:一种应用于四旋翼控制中的编码器 - 原型 - 解码器方法,用于挑战性风环境
通过 EPD 多任务元学习方法和 Proto-MPC 模型预测控制问题的集成,提高四旋翼机在动态变化任务中的适应性和操作能力,该方法在模拟中经验证明具有鲁棒的性能。
- 使用监督学习构建短视多方计算策略
使用监督学习技术结合模型预测控制(MPC)在近期引起了显著关注,特别是在近似显式 MPC 领域,其中使用深度神经网络等函数逼近器通过离线生成的最优状态 - 动作对来学习 MPC 策略。本文考虑了一种替代策略,即使用监督学习离线学习最优值函数 - 一种自主决策系统的分层控制框架:HMDP 和 MPC 的整合
本文提出了一种全面的分层控制框架,用于机器人和自主系统中的自主决策。通过综合建模、设计问题的制定、控制设计和稳定性分析,提出了这种具有挑战性问题的综合设计过程和框架,并处理了连续系统动力学和离散马尔科夫决策过程在高层决策中的复杂相互作用。通 - 基于梯度的世界模型规划
人工智能中的持久挑战是控制系统以实现期望的行为。本研究介绍了一种基于梯度的规划方法,利用可微的世界模型,对比了其他基于 MPC 的方法和基于策略的算法,并在大多数任务中,在具有样本效率的设定下,实现了与其他方法相媲美甚至更好的性能。此外,引 - 签名遇见动态规划:推广贝尔曼方程用于轨迹跟踪
路径签名被提出作为一种强大的路径表示,能有效地捕捉路径的分析和几何特征,具有张量积快速连接路径的有用代数特性。最近,在机器学习问题中广泛采用签名进行时间序列分析。本研究通过建立问题中常用的值函数和路径签名的有趣特性之间的联系,提出了一种称为 - 填补空白:受模型预测控制启发的可证实无模型二次规划控制器的学习
本文提出了一种新的参数化控制器,借鉴了模型预测控制(Model Predictive Control)的思想。这些控制器采用与线性模型预测控制类似的二次规划结构,通过学习问题参数而不是从模型中导出。该方法可能解决深度强化学习中常见学习控制器 - H-GAP:具备广义规划器的人形控制
人型控制是一个重要的研究挑战,为人类中心基础设施的整合和物理驱动的人型动画提供了可能。我们提出了一种名为 H-GAP 的人型通用自编码规划器,它是基于人型轨迹数据训练得到的模型,能够通过模型预测控制(MPC)熟练地处理下游控制任务。H-GA - 自主车辆的车道保持控制通过软约束迭代式 LQR
通过软约束迭代线性二次调节器算法结合模型预测控制约束松弛方法,开发了一种在汽车车道保持控制中解决抖动问题的算法,通过软化优化过程中的约束,能够相对简单地计算稳定的控制输入轨迹,提高自动驾驶车辆的操控平滑度和追踪精度。
- 基于模型预测控制的公路匝道计量的强化学习
基于模型和学习策略的协同作用,以及嵌入强化学习技术在模型预测控制框架内,以提高交通流量管理的创新方法为控制问题的公式化,该方法考虑了道路匝道入口流量控制的变数模型和需求不确定性,并通过模拟实验验证了其有效性。
- 输入凸 LSTM: 一种基于凸优化的快速 Lyapunov 模型预测控制方法
该研究基于输入凸神经网络(ICNN),提出了一种用于基于 Lyapunov 的 MPC 的新型输入凸 LSTM,旨在减少收敛时间、缓解梯度消失问题并确保闭环稳定性。模拟非线性化学反应器实验结果显示,相对于基准普通循环神经网络、普通 LSTM - 基于物理信息的机器学习控制方法在高噪声测量下的非线性动态系统中的应用
该研究提出了一种基于物理信息的机器学习控制方法,用于具有高噪声测量的非线性动态系统。结果表明,该方法在高噪声条件下的非线性动态系统的建模准确性和控制性能方面优于现有的基准方法。
- 自主车辆的交互式运动规划与联合优化
MPC 与学习预测模型相结合的交互联合规划(IJP)在计算上可扩展的方式上提供了最佳结果。
- 神经势场的避障局部运动规划
使用神经潜力场的模型预测控制方法在移动机器人平台上提供局部运动规划,通过神经网络模型基于机器人姿态、障碍地图和机器人足迹返回可微的避碰成本。实验证明该方法与现有的局部规划方法相当,提供的轨迹平滑性较好,并与障碍物保持安全距离,而且在 Hus