AAAIMar, 2019

基于障碍函数的端到端安全强化学习在安全关键型连续控制任务中的应用

TL;DR本文提出了一种控制器架构,该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合,以确保学习过程中的安全,并利用高斯过程对系统动态进行建模和不确定性分析。