May, 2020

神经李亚普诺夫控制

TL;DR本研究提出了一种新的方法来学习控制策略和非线性控制问题的神经网络李雅普诺夫函数,具有稳定性的可证明保障。该方法包括一个学习者和一个伪造器,通过快速引导学习者寻找控制和李雅普诺夫函数并寻找反例来终止程序,以保证控制的非线性系统的稳定性。该方法极大地简化了李雅普诺夫控制设计的过程,提供了端到端的正确性保证,并且可以获得比现有方法如 LQR 和 SOS/SDP 更大的吸引域范围。我们进行了实验,展示了新方法如何获得高质量的解决方案以应对具挑战性的控制问题。