Dec, 2022

基于控制壁函数的安全反向强化学习

TL;DR本文提出了一个名为CBFIRL的安全IRL框架,利用控制屏障函数(CBF)增强IRL策略的安全性,通过梯度下降联合优化CBF要求灵感的损失函数和IRL方法的目标,在实验中表明我们的框架相较于没有CBF的IRL方法更加安全,并展示了在2D赛车领域的两个难度级别和3D无人机领域的安全性提高了15%和20%和50%。