基于交叉熵深度学习的 PID 调参：一种李雅普诺夫稳定性分析

Apr, 2024

基于交叉熵深度学习的 PID 调参：一种李雅普诺夫稳定性分析

PID Tuning using Cross-Entropy Deep Learning: a Lyapunov Stability Analysis

Hector Kohler, Benoit Clement, Thomas Chaffre, Gilles Le Chenadec

TL;DR研究论文提出了一种基于学习的自适应控制系统，使用交叉熵深度学习方法确定自适应参数，并通过实验和指标对其稳定性进行了研究。

Abstract

underwater unmanned vehicles (UUVs) have to constantly compensate for the external disturbing forces acting on their body. adaptive control theory is commonly used there to grant the control law some flexibility

underwater unmanned vehicles adaptive control theory learning-based adaptive methods stability analysis cross-entropy deep learning

发现论文，激发创造

面向水下无人机在水流干扰下的自适应控制参数的虚实转换

利用学习驱动的自适应控制方法，结合基于模型的控制架构以及最大熵深度强化学习框架，提出了一种适应控制器的创新方法，通过生物启发的经验回放机制、增强的领域随机化技术和在物理平台上的评估协议来实现仿真到真实的迁移策略，实验证明该方法能够从 AUV 的次优仿真模型中学到有效的策略，并在实际环境中将控制性能提高 3 倍。

Oct, 2023

基于数据驱动的多目标振翅式无人水下机器人控制系统的机器学习模型

利用时间序列神经网络代替推进力学模型，开发搜索式反向模型控制系统，以多个目标为目标，找到一组鳍动力学参数，并演示了如何集成此模型来进行在线控制。

Sep, 2022

基于分布式神经动力学的反步最优控制：鲁棒约束一致性下的非完全驱动水下车队

该论文采用一种基于共识的优化协调协议和鲁棒控制器，通过引入球面坐标变换和分布式优化运动协调策略解决了非完整约束问题，并设计了基于神经动力学的鲁棒反馈控制器来处理欠驱动问题，确保在存在未知干扰情况下，UUVs 编队系统的稳定性和所有状态的一致有界性。通过广泛的仿真比较，验证了所得到的最优编队跟踪协议的优越性和有效性。

Aug, 2023

一种生物启发的神经动力学辅助无人水下航行器的混合跟踪控制策略

该研究论文提出了一种基于仿生神经动力学模型的新型混合控制策略，以提高无人水下车辆的跟踪控制，将改进后的后向运动学控制策略与新型滑模控制相结合，以实现控制信号的平滑性，这在无人水下车辆的实际应用中尤为重要。

Sep, 2022

利用模型预测路径积分控制增强 AUV 自主性

自主水下航行器（AUV）在测量海洋环境、进行水下检查任务和海洋探索方面发挥着关键作用。本研究探讨了使用模型预测路径积分控制（MPPI）对 AUV 进行控制的可行性，并对主要超参数对 MPPI 控制器性能的影响进行了详细评估。同时，我们将所提出方法与经典的 PID 和级联 PID 方法进行了比较，证明了我们提出的控制器的优越性。最后，我们加入了环境约束并展示了 MPPI 如何通过将这些约束整合在成本函数中来处理它们。

Aug, 2023

面向控制的域感知神经网络模型用于自主水下车辆

本文介绍了利用已知系统结构和先前的物理知识创造受约束的深度神经动力系统模型的具有不同程度领域知识的控制定向参数模型。使用通用微分方程构造了 AUV 动力学的数据驱动的黑盒和灰箱表示，评估了不同初始条件和控制输入的学习模型的预测性能，以评估其准确性，泛化性和控制适用性。

Aug, 2022

分布鲁棒策略与李雅普诺夫证明学习

论文介绍了一种新颖的方法，用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式，确保 Lyapunov 证书的单调减少，解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中，证明了在包括超出分布范围的模型不确定性的情况下，闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中，将该方法与无关不确定性的基准方法和几个强化学习方法进行比较，验证了所提出方法的有效性和高效性。

Apr, 2024

水下舰艇共识形成跟踪的分布式强健学习反步控制辅助神经动力学

研究了一种适用于多个水下舰艇的分布式鲁棒学习控制策略，考虑到完全不知道舰艇的系统参数以及建模误差、海洋干扰和噪声，通过图论合成具有稳定性保证的分布式控制器，并采用回步控制技术处理动态模型中的参数不确定性，提出了在线学习过程来处理时变和未知系统，并引入神经动力学模型来解决建模误差、环境干扰和测量噪声问题，通过稳定性分析确保了理论层面上的鲁棒自适应性能，最后通过大量的仿真实验验证了所提出的分布式控制策略的有效性。

Aug, 2023

四轴飞行器控制的基于混合 Actor-Critic 神经结构的自适应 PID 控制

本文探讨了使用基于强化学习的神经网络自整定的 PID 控制算法，应用于四旋翼飞行器的姿态和高度控制，在动态和静态增益的调整中使用了适应性动量（ADAM）优化器和反向传播（BP）算法，并证明该方法比具有恒定增益的 PID 控制器具有更好的性能。

Jul, 2023

基于贝叶斯学习的适应性安全关键系统控制

提出了一种满足安全性和实时性约束，利用贝叶斯模型学习和随机 CLFs、CBFs 控制框架的深度神经网络模型不确定性学习的方法，并在高速行进的火星车任务中进行了演示。

Oct, 2019