safety critic | BriefGPT - AI 论文速递

关键词safety critic

搜索结果 - 4

安全评论引导的强化学习系统修复
使用反例引导的修复算法通过梯度受限优化来修复强化学习系统中的安全缺陷，包括修复强化学习代理和安全评论家。
PDFa month ago
多约束安全强化学习与目标抑制在安全关键应用中的应用
通过适应性抑制任务奖励最大化目标的方法，我们提出了目标抑制（Objective Suppression）的创新方法，以解决具有多个约束的安全强化学习任务所面临的挑战，在两个多约束安全领域进行了基准测试，包括一个自动驾驶领域，其中任何不正确的
PDF4 months ago
安全优化增强学习通过多目标策略优化
基于多目标策略优化框架的新型无模型安全强化学习算法引入，通过环境奖励函数和安全评论家对策略进行优化，以实现在不违反约束条件的情况下同时达到最佳和安全性。该算法通过理论分析提出了收敛策略的安全性保障条件，并引入了一个攻击参数，允许对所述权衡进
PDF4 months ago
利用随机潜在表示从像素学习安全强化学习
本文提出了一种基于像素观察安全的强化学习方法，在部分可观察的马尔可夫决策过程框架下，使用一种新颖的安全评估方法来训练安全策略，使用基准数据证明了其相对于现有方法具有竞争性的性能和满足安全约束条件。
PDF2 years ago