Mar, 2024

全球稳定的神经仿真策略

TL;DR通过引入稳定神经动力系统(SNDS),我们提出了一种保证稳定性的模仿学习方案,该方案通过联合训练策略和对应的 Lyapunov 候选者来构建具有正式稳定性保证的策略。我们在模拟环境中进行了广泛的实验并成功地将训练得到的策略部署于真实的机械臂,实验结果表明我们的方法解决了以往模仿学习方法中的不稳定性、准确性和计算强度问题,为复杂规划场景中的稳定策略学习提供了有希望的解决方案。