使用强健神经李亚普诺夫障函数的安全非线性控制
本文研究使用控制李亚普诺夫壁函数(CLBF)来分析安全性和可达性,使用 Lyapunov 壁演员 - 评论家(LBAC)算法进行数据驱动寻找控制器,以实现无模型的强化学习在机器人控制中的广泛应用。在模拟实验和真实机器人控制实验中,实验结果显示了该方法在可达性和安全性方面的优异表现。
May, 2023
利用控制屏障函数的机器学习框架可以降低非线性控制系统中的模型不确定性,从而实现系统的安全行为。通过在 Segway 平台上进行模拟和实验验证,这种方法可以持续收集数据并更新控制器,最终实现安全行为。
Dec, 2019
本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数,具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器,通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序,以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程,提供了端到端的正确性保证,并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验,展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。
May, 2020
本文提出了一个安全学习框架,该框架采用自适应模型学习算法以及障碍证书,用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构,并结合控制障碍证书来保持安全。在一定条件下,保证了违反安全性后的 Lypunov 稳定恢复。最终证明了该框架通过仿真和测试的方式,在具有未知、高度复杂和非平稳动态的机器人系统中是有效的。
Jan, 2018
本文提出一种基于学习的方法来合成安全控制器,该方法基于控制屏障函数,考虑非线性控制仿射动力系统的情况,并假设我们可以访问由专家生成的安全轨迹,在此基础上,提出和分析了基于优化的 CBF 学习方法,其具有可证明的安全保证。
Apr, 2020
本文提出了一种基于神经网络构建 Lyapunov 函数并通过训练算法将其适应到状态空间中最大安全区域形状的方法,以学习非线性闭环动力系统的准确安全证明,并在模拟倒立摆中演示了该方法的应用,讨论了如何将该方法与动态系统的统计模型一起用于安全学习算法。
Aug, 2018
本文提出了一种基于强化学习框架的方法,利用 CBF、CLF 等约束条件中存在的模型不确定性,并结合标称模型的 CBF-CLF-QP,得到了强化学习驱动的 CBF-CLF-QP,有效解决了安全约束中的模型不确定性问题。实验证明,在一个脚踩随机分布台石的非完全驱动非线性双足机器人上,此方法保证了机器人的安全和稳定行走。
Apr, 2020
本文提出了一个基于控制栅函数 (control barrier function, CBF) 和控制李雅普诺夫函数 (control Lyapunov function, CLF) 方法的强化学习 (reinforcement learning, RL) 框架,称之为 Barrier-Lyapunov Actor-Critic (BLAC) 框架,它有助于维护系统的安全性和稳定性。本框架通过基于重放缓冲器中采样的数据构建安全性的控制障碍函数约束和稳定性的控制李雅普诺夫函数约束,并使用增广拉格朗日方法来更新基于 RL 的控制器的参数。此外,本文还引入了一种备份控制器,以防安全和稳定性约束无法同时满足时 RL 控制器不能提供有效的控制信号。仿真结果证明,相对于基线算法,该框架产生的控制器可以帮助系统接近期望状态,并导致更少的安全约束违反。
Apr, 2023
本文提出一种基于学习的方法,通过构建基于神经网络的 Control Barrier Functions (CBFs) 来确保广泛类别的非线性混合动力系统的安全,从而解决现有方法的计算效率低、对系统性能不利或仅适用于小规模系统的问题。
Jan, 2024