零样本 Sim2Real 环境自适应

Feb, 2023

Zero-shot Sim2Real Adaptation Across Environments

Buddhika Laknath Semage, Thommen George Karimpanal, Santu Rana, Svetha Venkatesh

TL;DR提出了使用 Reverse Action Transformation（RAT）策略的方法来解决模拟到现实世界之间的转换问题，并且和其他基线模型相比，在连续控制任务中可实现零样本适应。

Abstract

simulation based learning often provides a cost-efficient recourse to reinforcement learning applications in robotics. However, simulators are generally incapable of accurately replicating real-world dynamics, and thus bridging the →

simulation based learning sim2real gap neural residual models reverse action transformation (rat) policy zero-shot adaptation

发现论文，激发创造

通过模拟对实际现实进行调和：一种用于强大操纵的实际到模拟到实际的方法

通过模拟环境构建数字双子，提出了一种通过强化学习来增强真实世界模仿学习策略的系统 RialTo，实现高性能、鲁棒性的策略的学习，同时避免大量不安全的真实数据收集和大量人工监督。

Mar, 2024

相互对齐迁移学习

通过强化学习在模拟环境中训练机器人并结合补充奖励策略，与真实机器人进行进一步的微调来优化探索策略，实验结果表明，这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。

Jul, 2017

动态随机化的机器人控制的仿真到实际转移

本文介绍了一种简单的方法来解决在模拟训练中的现实差距问题。通过在训练过程中随机化模拟器的动力学，我们能够开发出适应非常不同的动力学的策略，并且使其在真实世界中推广而不需要在物理系统上进行训练。在机器人控制方面，我们的方法在物体推动任务上表现出了很好的性能。

Oct, 2017

基于信任域的少样本模拟实现增强学习

使用仿真技术最小化对真实世界交互的需求，在少样本离线动力学设置下，引入了一种新方法，通过惩罚来限制仿真训练策略引发的轨迹，以解决常规强化学习代理倾向于利用仿真不准确性的挑战。在各种环境中评估了我们的方法，包括代表不同仿真到真实条件的高维系统，并且在大多数测试场景中，我们的方法相比现有基线模型表现出改进。

Dec, 2023

在实际环境中学习高效准确导航

在自主导航的地面机器人领域，现有的研究大多使用真实感的动力学和感知模型，而本篇论文致力于通过在仿真环境中进行端到端的训练，减小模型在现实机器人平台上的差距，并取得了显著的性能和稳健性的提升。

Jan, 2024

泛化自驾车策略的模仿学习及模拟转现实

本文研究应用 Imitation Learning 和 transfer learning 方法解决 Duckietown 场景下的机器人车道跟踪问题，并通过 sim-to-real 方法进行实际环境迁移，最终比较了三种 Imitation Learning 方法和两种 sim-to-real 方法的优缺点。

Jun, 2022

通过在线纠正学习进行模拟到现实策略迁移

通过人机协作的数据驱动方法，TRANSIC 提出了一种能够成功实现从模拟环境到真实世界转换的综合性方法，通过引入人类观察和干预机器人在真实世界中的执行来缩小不同的模拟与现实之间的差距。该方法通过整合从模拟和人类中学习到的策略，在复杂和接触丰富的操作任务中实现了成功的模拟到现实的转换。

May, 2024

深度强化学习和 Real2Sim 策略适应在机器人视觉插入中的应用

本文提出了一种基于纯视觉强化学习的插入任务解决方案，并提出了一种新颖的 Sim2Real 策略 Real2Sim，该策略在政策适应方面具有优势。

Jun, 2022

学习生成增强图像用于模拟到真实场景的策略迁移

本文探讨在模拟环境中学习机器人操作策略的方法，通过使用深度图像数据的随机扩增策略，实现了在非真实场景下学习并获得了验证。

Mar, 2019

自然语言有助于缩小 Sim2Real 鸿沟

通过使用自然语言描述图像作为统一的信号来捕捉底层的任务相关语义，我们提出了一种方法来解决在学习图像条件机器人策略时所面临的模拟与真实世界之间的视觉差距问题，该方法通过对大量模拟数据和少量真实演示进行同时训练，将图像编码器作为无域变迁的图像表示的基础，并取得了较之前的 Sim2Real 方法和 CLIP、R3M 等强大的视觉 - 语言预训练方法 25 至 40% 的性能提升。

May, 2024