BriefGPT.xyz
Ask
alpha
关键词
exact penalty optimization
搜索结果 - 1
ICML
SafeRL-Kit:用于安全自主驾驶的高效强化学习方法评估
本文提供 SafeRL-Kit 工具套件,其中包括最新的针对零违约任务的算法,详细比较 SafeRL-Kit 中的算法在安全自主驾驶方面的实用性,其中包括一个新的一阶方法 Exact Penalty Optimization (EPO)。
PDF
2 years ago
Prev
Next