BriefGPT.xyz
Ask
alpha
关键词
safe rl methods
搜索结果 - 2
ICML
SafeRL-Kit:用于安全自主驾驶的高效强化学习方法评估
本文提供 SafeRL-Kit 工具套件,其中包括最新的针对零违约任务的算法,详细比较 SafeRL-Kit 中的算法在安全自主驾驶方面的实用性,其中包括一个新的一阶方法 Exact Penalty Optimization (EPO)。
PDF
2 years ago
学习恢复区的安全强化学习(Recovery RL)
本文提出了一种名为 Recovery RL 的算法,它通过利用离线数据来学习约束违规区域并将任务性能和约束满足的目标分别交给两个策略来平衡任务收益与安全性,并在六个仿真领域和一个物理机器人上进行了试验,证明 Recovery RL 在这些领
→
PDF
4 years ago
Prev
Next