Sep, 2024

具有稳定性保证的随机强化学习在未知非线性系统控制中的应用

TL;DR本研究解决了高维未知动态非线性系统控制的稳定性问题,传统强化学习算法在此任务中的表现不足。我们提出了一种新的强化学习算法,通过学习系统动力学的局部线性表示来实现稳定控制,并将学习得到的增益矩阵直接整合进神经策略中。实验结果表明,该算法在多种高维动态系统中表现优于主流强化学习算法,成功实现了系统的稳定性。