该研究针对被深度强化学习训练的腿式机器人关节执行器的对抗攻击进行了探讨,发现对执行器扭矩控制信号的对抗扰动会显著降低机器人的奖励并导致行走不稳定。作者使用黑盒对抗攻击策略,采用三种搜索方法在 OpenAI Gym 的环境下对四足机器人 Ant-v2 和双足机器人 Humanoid-v2 进行实验,证明差分进化方法可以高效地找到最强的扭矩扰动,并发现四足机器人 Ant-v2 容易受到对抗攻击的影响,而双足机器人 Humanoid-v2 相对稳定。因此,这种关节攻击可用于机器人步态不稳定的主动诊断。
May, 2022
通过串行对抗攻击来识别学习行动控制器的弱点,验证了即使是最先进的鲁棒控制器也可能在设计良好、低幅度的对抗序列下显著失败,并展示了该方法生成的结果如何用于加强原始策略并深入了解这些黑盒策略的安全性。
May, 2024
本文证明了在对骨骼长度进行干扰的情况下,即使在大大降低的维度下,骨骼动作识别模型也容易受到对抗攻击,并且在此设置下,骨骼长度攻击的对抗训练与数据增强具有相似的特性,既提高了对抗强度,也提高了对原始数据的分类准确率。
Sep, 2021
使用深度强化学习中的多任务学习技术和安全控制框架在实际机器人系统中实现了自动学习四条腿机器人在三种不同地形上的步态。
Feb, 2020
本文提出了一种适用于机器人的新的元学习方法,结合了基于演化策略的元学习和更具噪声容忍度的 Batch Hill-Climbing 适应算子,显著提高了机器人在高噪声环境下的动态变化适应能力。在测试时,我们的方法比基于梯度的方法性能更好,使机器人能够在不到 3 分钟的实际数据基础上适应变化。
Mar, 2020
提出使用增强学习学习整体控制策略来实现对四肢机器人的控制,以解决四肢协调和模块间错误传播的问题,该统一策略可在多种任务设置中展示动态和敏捷行为。
Oct, 2022
本研究采用深度学习技术,针对基于骨骼的动作识别的敌对性弱点进行分析,并提出了一种基于约束优化和 ADMM 的优化算法及防御机制。经过广泛评估,该方法在不同情境下具有良好的攻击及防御效果。
May, 2020
通过离线博弈强化学习,用于合成高度鲁棒的安全过滤器以实现腿式机器人在不确定的、新颖环境中的安全操作。
通过深度强化学习和进化形态学,本研究探索了一种新型的过约束机器的设计与学习,旨在开发具有卓越能量效率的现代机器人四肢设计。研究结果显示,相较于平面四肢,在不同地形上,包括地板、斜坡和楼梯,过约束四肢的运动更加高效,至少可节省 22% 的机械能量,在平地上的平均速度是平面四肢的 20% 更快。
Jul, 2024
本研究基于深度强化学习控制器的支持下,通过学习遵循给定步长序列的原则,利用程序生成的步长方案实现了全向行走、原地转弯、站立和爬楼梯等多项功能,同时具备适应性强、无需预训练权重、不依赖参考动作等特点,为改进人形机器人在现实环境中行走鲁棒性提供了新思路。
Jul, 2022