Apr, 2020

使用控制李雅普诺夫函数和控制阻碍函数的模型不确定性下安全关键控制的强化学习

TL;DR本文提出了一种基于强化学习框架的方法,利用 CBF、CLF 等约束条件中存在的模型不确定性,并结合标称模型的 CBF-CLF-QP,得到了强化学习驱动的 CBF-CLF-QP,有效解决了安全约束中的模型不确定性问题。实验证明,在一个脚踩随机分布台石的非完全驱动非线性双足机器人上,此方法保证了机器人的安全和稳定行走。