零样本 Sim2Real 环境自适应
通过模拟环境构建数字双子,提出了一种通过强化学习来增强真实世界模仿学习策略的系统 RialTo,实现高性能、鲁棒性的策略的学习,同时避免大量不安全的真实数据收集和大量人工监督。
Mar, 2024
通过强化学习在模拟环境中训练机器人并结合补充奖励策略,与真实机器人进行进一步的微调来优化探索策略,实验结果表明,这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。
Jul, 2017
本文介绍了一种简单的方法来解决在模拟训练中的现实差距问题。通过在训练过程中随机化模拟器的动力学,我们能够开发出适应非常不同的动力学的策略,并且使其在真实世界中推广而不需要在物理系统上进行训练。在机器人控制方面,我们的方法在物体推动任务上表现出了很好的性能。
Oct, 2017
使用仿真技术最小化对真实世界交互的需求,在少样本离线动力学设置下,引入了一种新方法,通过惩罚来限制仿真训练策略引发的轨迹,以解决常规强化学习代理倾向于利用仿真不准确性的挑战。在各种环境中评估了我们的方法,包括代表不同仿真到真实条件的高维系统,并且在大多数测试场景中,我们的方法相比现有基线模型表现出改进。
Dec, 2023
在自主导航的地面机器人领域,现有的研究大多使用真实感的动力学和感知模型,而本篇论文致力于通过在仿真环境中进行端到端的训练,减小模型在现实机器人平台上的差距,并取得了显著的性能和稳健性的提升。
Jan, 2024
本文研究应用 Imitation Learning 和 transfer learning 方法解决 Duckietown 场景下的机器人车道跟踪问题,并通过 sim-to-real 方法进行实际环境迁移,最终比较了三种 Imitation Learning 方法和两种 sim-to-real 方法的优缺点。
Jun, 2022
通过人机协作的数据驱动方法,TRANSIC 提出了一种能够成功实现从模拟环境到真实世界转换的综合性方法,通过引入人类观察和干预机器人在真实世界中的执行来缩小不同的模拟与现实之间的差距。该方法通过整合从模拟和人类中学习到的策略,在复杂和接触丰富的操作任务中实现了成功的模拟到现实的转换。
May, 2024
本文提出了一种基于纯视觉强化学习的插入任务解决方案,并提出了一种新颖的 Sim2Real 策略 Real2Sim,该策略在政策适应方面具有优势。
Jun, 2022
通过使用自然语言描述图像作为统一的信号来捕捉底层的任务相关语义,我们提出了一种方法来解决在学习图像条件机器人策略时所面临的模拟与真实世界之间的视觉差距问题,该方法通过对大量模拟数据和少量真实演示进行同时训练,将图像编码器作为无域变迁的图像表示的基础,并取得了较之前的 Sim2Real 方法和 CLIP、R3M 等强大的视觉 - 语言预训练方法 25 至 40% 的性能提升。
May, 2024