ICMLDec, 2022

使用概率控制障碍函数进行安全强化学习以实现匝道合并

TL;DR控制屏障函数嵌入强化学习策略中,使用概率控制屏障函数作为模型不确定性的估计,实现了安全而高效的自动驾驶算法,可以应用于高速公路匝道合并问题。