Apr, 2024

AD4RL:用基于价值的数据集进行离线强化学习的自动驾驶基准

TL;DR本研究提供了自动驾驶数据集和离线强化学习算法的基准,其中包含 19 个数据集,包括真实世界的人类驾驶员数据集,并提供三种真实行驶场景下的七种流行的离线强化学习算法,同时提供了一个统一的决策过程模型作为算法设计的参考框架,为探索现有强化学习方法的实际方面奠定了基础。