闭环模拟与实现：将模拟随机化应用于现实世界的经验中

Oct, 2018

闭环模拟与实现：将模拟随机化应用于现实世界的经验中

Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

Yevgen Chebotar, Ankur Handa, Viktor Makoviychuk, Miles Macklin, Jan Issac...

TL;DR本文提出了一种基于模拟场景的策略转移方法，通过改变模拟参数分布并结合少量真实世界回合的训练，以实现在不同机器人任务中的可靠策略转移。

Abstract

We consider the problem of transferring policies to the real world by training on a distribution of simulated scenarios. Rather than manually tuning the randomization of simulations, we adapt the simulation parameter distribution using a few →

policy transfer simulated scenarios real world roll-outs simulation parameter distribution robotic tasks

发现论文，激发创造

动态随机化的机器人控制的仿真到实际转移

本文介绍了一种简单的方法来解决在模拟训练中的现实差距问题。通过在训练过程中随机化模拟器的动力学，我们能够开发出适应非常不同的动力学的策略，并且使其在真实世界中推广而不需要在物理系统上进行训练。在机器人控制方面，我们的方法在物体推动任务上表现出了很好的性能。

Oct, 2017

策略优化的政策转移

本研究提出了一种基于域随机化的控制策略迁移方法，通过同时学习多种不同行为的控制策略来应对目标环境与训练环境之间的差异，而无需对动态参数进行识别，实验表明该方法可以成功地解决模型误差较大的情况。

Oct, 2018

机器人操作任务的强化学习中随机化效应对于 Sim2Real 转移的分析

本研究定义了一种易于重现的实验设置，用于比较四种随机化策略及三种随机参数在仿真和实验机器人上完成的任务。研究发现，完全随机生成仿真和精细调整策略可以更好地转移到现实机器人，并且比其他测试方法更有差异化的结果。

Jun, 2022

学习主动任务导向的探索策略，弥合模拟与现实之间的差距

本文提出并分析了一种基于任务导向探索的框架，该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数，并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明，任务导向的探索有助于在系统参数未知时，使基于模型的策略适应更好，从而实现更好的任务表现。

Jun, 2020

域随机化：从仿真到真实世界的深度神经网络转移

探究了一种称为 “Domain Randomization” 的技术，该技术使用非真实随机纹理来训练深度神经网络对象定位器，使得该定位器在真实环境中表现出色，并且可以应用于机器人控制中。

Mar, 2017

机器人深度强化学习中的模拟到真实转移：一项调查

本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景，包括不同方向的方法和应用场景，重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。

Sep, 2020

相互对齐迁移学习

通过强化学习在模拟环境中训练机器人并结合补充奖励策略，与真实机器人进行进一步的微调来优化探索策略，实验结果表明，这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。

Jul, 2017

通过在线纠正学习进行模拟到现实策略迁移

通过人机协作的数据驱动方法，TRANSIC 提出了一种能够成功实现从模拟环境到真实世界转换的综合性方法，通过引入人类观察和干预机器人在真实世界中的执行来缩小不同的模拟与现实之间的差距。该方法通过整合从模拟和人类中学习到的策略，在复杂和接触丰富的操作任务中实现了成功的模拟到现实的转换。

May, 2024

在仿真环境中评估实际机器人操纵策略

机器人学中的评估与模拟环境之间的控制和视觉差异是可靠的模拟评估的关键挑战，在创建适用于常见真实机器人设置的 SIMPLER 模拟环境的基础上，我们证明了在这些环境中的政策表现与真实世界中的表现之间的强相关性，同时准确反映了真实世界的政策行为模式，通过我们的工作流以及开源的 SIMPLER 环境，促进了通用操作策略和模拟评估框架的研究。

May, 2024

鲁棒的视觉从模拟到实际的机器人操作转移

通过在模拟环境中学习视觉运动策略，我们提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题，并在丰富的机器人操作任务中进行了基准测试。我们的方法在各种挑战性的操纵任务中取得了 93% 的成功率，并证明了模拟器训练的策略在真实场景中的视觉变化下具有更好的鲁棒性。

Jul, 2023