ICMLMay, 2024

安全强化学习的一致性可行性表征学习

TL;DR在安全强化学习领域,通过结合表示学习和可行性导向目标,我们引入了一种名为 Feasibility Consistent Safe Reinforcement Learning(FCSRL)的新框架,以从原始状态中提取与安全相关的信息从而增强策略学习和约束估计。在多种向量状态和基于图像的任务的实证评估中,我们的方法能够学习到更好的安全感知嵌入并取得优越的性能,超过了先前的表示学习基线。