safety violations | BriefGPT

关键词safety violations

搜索结果 - 4

基于基础世界模型的自主机器人零射击安全预测
提出了基础世界模型，通过将观察结果转化为有意义且因果潜在的表示，使代理动力学可以直接预测因果未来状态，并且在安全预测任务中表现优于标准世界模型，与监督学习相比具有可比拟的性能，而且不需要使用任何数据。
PDF3 months ago
基于像素观测的逐州安全强化学习
本文提出了一种新的像素观测安全强化学习算法，通过引入潜在障碍函数学习机制，高效地编码未知危险区域的状态安全约束，并通过在潜在动力学上建立和学习潜在障碍函数以及同时进行策略优化的联合学习框架，从而在提高安全性和总预期收益方面取得显著的结果。在
PDF8 months ago
2D 和 3D 深度学习模型鲁棒性和安全性对抗性攻击调查
通过构建威胁模型、综述 2D 和 3D 对抗性攻击的最新进展以及扩展对物理对抗性攻击的研究，本文探究了深度学习模型的鲁棒性与安全性，并总结了目前的热门话题，对挑战给出了见解，并对未来值得研究的可信 AI 提出了建议。
PDF9 months ago
通过想象近未来来实现安全强化学习
本研究关注应用于现实世界问题中的强化学习算法，提出了一种基于模型的算法可以规避不安全状态并降低安全违规，在连续控制任务中取得相当的回报.
PDF2 years ago