使用收缩度量学习认证控制

Nov, 2020

Learning Certified Control using Contraction Metric

Dawei Sun, Susmit Jha, Chuchu Fan

TL;DR本文提出了一种基于神经网络的学习框架，利用控制收缩度量的先进理论来设计证明控制策略，使机器人在任何初始状态和有界干扰下都能按预定轨迹移动，实现安全的运动规划，并验证了其收敛性和误差保证。实验表明，该方法可以处理更广泛的系统，具有更少的跟踪误差和更快的执行速度。

Abstract

In this paper, we solve the problem of finding a certified control policy that drives a robot from any given initial state and under any bounded disturbance to the desired reference trajectory, with guarantees on the co

certified control policy robot motion planning neural networks convergence tracking error

发现论文，激发创造

通过学习的压缩度量，对未知系统进行安全反馈运动规划中的模型误差传播

本文提出了一种基于收缩反馈的运动规划方法，通过学习动力学的深度控制函数逼近，建立了在未知动力学系统中的安全交互方式，包括控制器优化和轨迹跟踪，并在高维度的动力学系统中进行了验证。

Apr, 2021

基于学习感知模块和压缩理论的图像安全输出反馈运动规划

本研究提出了一种针对不确定控制仿射非线性系统的运动规划算法，在使用高维传感器测量（如 RGB-D 图像）和一个学习感知模块的反馈控制环路时保证运行时安全性和目标可达性。

Jun, 2022

神经收缩动力系统

我们提出了一种新的方法来学习神经收缩动力系统，使得我们的神经网络结构确保收缩从而实现全局稳定性。为了有效地应用于高维动力系统，我们开发了一种变分自编码器的变体，它学习低维潜在表示空间中的动力学，并在解码后保持收缩稳定性。此外，我们进一步将我们的方法扩展到旋转李群上学习具有避障能力的收缩系统。经验证明，我们的方法比当前的最先进方法更准确地编码了所需的动力学，并提供了更强的稳定性保证。

Jan, 2024

使用基于收缩的正则化方法学习稳定非线性动力学

提出了一种新的学习稳定非线性动态系统的框架，其中包括控制理论正则化器，以用于机器人连续控制任务，并且通过将稳定性概念根源化来保证稳定性的存在。

Jul, 2019

安全控制策略的神经证书

本文提出一种方法，通过联合学习障碍函数和类李亚普诺夫函数的神经网络来实现动态系统的安全和目标控制，该方法在摆、小车倒立杆和无人机等动态系统中得到了有效应用。

Jun, 2020

神经网络控制系统可达性分析中的收缩引导自适应划分

本研究提出了一种基于收缩率指导的自适应分区算法，用于改进非线性反馈环路中神经网络控制器及干扰对区间值可靠范围估计的影响。该算法利用对上估计间隔的收缩率的估计结果，在选定时间和位置进行分区，并通过神经网络验证步骤和可达性分区层的分离，以小的计算成本提供准确性改进。使用基于收缩的稳健性分析，我们提供了混合单调到达性的算法性能保证。最后，通过几个数值模拟和与文献中现有方法的比较，证明了算法的性能表现，特别是在低运行时时间的情况下提高了到达集的估计精度。

Apr, 2023

基于数据的安全证书的可伸缩合成及其在基于学习的控制中的应用

本文提出了有效的技术来综合安全集合和控制律，通过基于凸优化问题的近似来提供改进的可伸缩性质，其中一种方法仅需要近似的线性系统模型和 Lipschitz 连续的未知非线性动力学，展示了数字示例，包括一个自主车队。

Nov, 2017

基于收缩论的强化学习稳定模块化控制

我们提出了一种新颖的方法，将控制技术与强化学习相结合，通过收缩理论实现神经控制的模块化，以确保稳定性。我们通过信号组合和动态分解实现这种模块化。信号组合通过创建潜在空间，其中强化学习应用于最大化奖励。动态分解通过坐标转换实现，创建辅助空间，其中潜在信号以一种方式耦合，保持稳定性，前提是每个信号（即每个子系统）具有稳定的自反馈。通过利用模块化，将非线性稳定性问题分解为代数可解的问题，即在辅助空间中的子系统稳定性，从而产生对控制网络输入梯度的线性约束，可以简单至网络权重的切换符号。这种最小侵入的稳定性方法易于集成到机器学习中的模块化神经架构中，如分层强化学习，并提高其性能。我们通过模拟演示了我们的方法的必要性和有效性：对于稳健性和泛化性的必要性以及改进分层强化学习的有效性。

Nov, 2023

基于价值限制的无模型连续控制

提出了一种基于 Lagrangian relaxation 的约束强化学习方法，通过同时优化任务奖励和某些辅助成本来确保任务成功，展示了在连续控制基准任务、优化能量的四足动物运动任务以及实际机器人臂夹取任务上，该方法的有效性。

Feb, 2019

传感运动控制下的一致策略学习面对分布偏移

该研究论文重点探讨了传感器运动控制器观测量分布的变化检测和反应问题，通过使用符合性预测的量位分位数作为输入设计切换策略，实现了传感器分布漂移的检测，并在仿真的自动驾驶和四足机器人主动感知的两个应用案例上验证了其优势和限制。

Nov, 2023