关键词safe deep reinforcement learning
搜索结果 - 2
- 用于术中螺钉椎弓根定位规划的安全深度强化学习
本文提出了一种基于实时观察的机器人脊柱手术规划方法,利用 Safe Deep Reinforcement Learning(DRL)计算钻孔路径,同时通过引入一个基于距离的不确定性感知安全过滤器保证安全,为手术提供尽可能高的成功率。实验表明 - 通过验证任务级别属性提供安全的深度强化学习
本文介绍了一种使用 “违规指标” 来惩罚无法确保安全的状态,从而更好地实现安全深度强化学习的方法,并在机器人地图导航任务中进行了实验研究,结果表明相较于进行 Safe DRL 的基线策略,使用违规指标的策略在性能上有了更好的表现,且能够大幅