ICMLJun, 2022

SafeRL-Kit:用于安全自主驾驶的高效强化学习方法评估

TL;DR本文提供 SafeRL-Kit 工具套件,其中包括最新的针对零违约任务的算法,详细比较 SafeRL-Kit 中的算法在安全自主驾驶方面的实用性,其中包括一个新的一阶方法 Exact Penalty Optimization (EPO)。