May, 2023

GUARD:一个安全的强化学习基准

TL;DR引入了通用统一的安全强化学习开发基准(GUARD), 它是一个广义基准测试,涵盖了各种 RL 智能体、任务和安全约束规格。通过使用 GUARD 进行各种任务设置下的现有安全强化学习算法的比较,建立了未来工作可以构建基线的基础。