Aug, 2023

朝向最优头对头自主赛车的课程加强学习

TL;DR头对头自主赛车的最优策略研究中,我们提出了一个基于课程学习的框架来逐步过渡到更复杂的真实环境,以教授强化学习代理一个更接近最优策略的方法,并提出了基于控制屏障函数的安全强化学习算法,既能有效保证代理的安全性又不会牺牲策略的最优性。