本文提出一种安全的强化学习框架,用于处理复杂的接触丰富的机器人操作任务,能够在任务空间和关节空间中保持安全,同时使机械臂与环境发生的接触力保持较小。该框架采用模拟训练,成功地在实际机器人上验证了其性能。
Jul, 2022
通过在 Panda 机械臂创建自定义环境,扩展安全强化学习算法的适用性,并通过与基准版本的比较表明,在满足安全约束条件的同时,受限版本能够学习到同样好的策略,但需要更长的训练时间。
Nov, 2023
本文提出人机协作的安全机器强化学习框架,包含安全探索,安全价值对齐,以及安全协作三个阶段,并探讨了机器强化学习中交互行为的四个技术挑战。
Feb, 2023
为了确保机器人等自主车辆的广泛部署,本文提出了一种新的闭环范式用于综合安全控制策略,明确考虑系统在可能的未来情景下的演变不确定性,通过物理动力学和机器人的学习算法共同推理,利用对抗深度强化学习进行放大,展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。
Sep, 2023
利用 GPU 模拟技术和模仿学习指导策略搜索以使强化学习培训可在高维机器人手表现复杂控制问题的领域中成为可能,最终演示了并行强化学习和模仿学习的互补优势和优秀的验证结果。
Dec, 2022
为了将 RL 算法部署到实际场景中并在学习过程中确保安全性,我们提出了使用转移学习方法学习在一个任务环境中如何保持安全性,然后将所学用于约束在学习新任务时的行为,此方法在三个具有挑战性的领域中实证,相比于标准的深度 RL 技术和以前的安全 RL 方法,我们的方法不但减少了安全事故,还提高了学习的速度和稳定性。
Oct, 2020
将基于学习的技术,特别是强化学习,整合到机器人技术中来解决非结构化环境中的复杂问题很具有前景。本文展示了我们如何以原则性的方式将复杂的安全约束强加于基于学习的机器人系统中,从理论和实践的角度进行了展示。
Apr, 2024
指导机器人与人类协同工作的更高级解决方案是必要的。由于实际合作需要进行物理接触,因此使用机器学习算法和机器人自我感知进行接触检测是实现此目的的关键挑战。这项工作利用深度度量学习来区分接触和非接触的机器人运动,并取得了非常有希望的结果,证明 DML 可以实现更精确的分类并具有良好的泛化能力。
通过综述方法与开放问题对最近几年来 RL 的安全和稳健性的相关研究工作进行总结,本文主要关注 RL 系统在现实场景中的安全性和稳健性挑战,探讨了算法、伦理和实践考虑等方面的主要维度以及如何增强 RL 代理的安全性和稳健性,同时讨论了环境因素和人的参与等影响因素,最后提出了一个实用的检查清单,以帮助从业者在各个应用领域负责任地部署 RL 系统。
Mar, 2024
使用深度强化学习中的多任务学习技术和安全控制框架在实际机器人系统中实现了自动学习四条腿机器人在三种不同地形上的步态。
Feb, 2020