闭环模拟与实现:将模拟随机化应用于现实世界的经验中
本文介绍了一种简单的方法来解决在模拟训练中的现实差距问题。通过在训练过程中随机化模拟器的动力学,我们能够开发出适应非常不同的动力学的策略,并且使其在真实世界中推广而不需要在物理系统上进行训练。在机器人控制方面,我们的方法在物体推动任务上表现出了很好的性能。
Oct, 2017
本研究提出了一种基于域随机化的控制策略迁移方法,通过同时学习多种不同行为的控制策略来应对目标环境与训练环境之间的差异,而无需对动态参数进行识别,实验表明该方法可以成功地解决模型误差较大的情况。
Oct, 2018
本研究定义了一种易于重现的实验设置,用于比较四种随机化策略及三种随机参数在仿真和实验机器人上完成的任务。研究发现,完全随机生成仿真和精细调整策略可以更好地转移到现实机器人,并且比其他测试方法更有差异化的结果。
Jun, 2022
本文提出并分析了一种基于任务导向探索的框架,该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数,并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明,任务导向的探索有助于在系统参数未知时,使基于模型的策略适应更好,从而实现更好的任务表现。
Jun, 2020
探究了一种称为 “Domain Randomization” 的技术,该技术使用非真实随机纹理来训练深度神经网络对象定位器,使得该定位器在真实环境中表现出色,并且可以应用于机器人控制中。
Mar, 2017
本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景,包括不同方向的方法和应用场景,重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。
Sep, 2020
通过强化学习在模拟环境中训练机器人并结合补充奖励策略,与真实机器人进行进一步的微调来优化探索策略,实验结果表明,这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。
Jul, 2017
通过人机协作的数据驱动方法,TRANSIC 提出了一种能够成功实现从模拟环境到真实世界转换的综合性方法,通过引入人类观察和干预机器人在真实世界中的执行来缩小不同的模拟与现实之间的差距。该方法通过整合从模拟和人类中学习到的策略,在复杂和接触丰富的操作任务中实现了成功的模拟到现实的转换。
May, 2024
机器人学中的评估与模拟环境之间的控制和视觉差异是可靠的模拟评估的关键挑战,在创建适用于常见真实机器人设置的 SIMPLER 模拟环境的基础上,我们证明了在这些环境中的政策表现与真实世界中的表现之间的强相关性,同时准确反映了真实世界的政策行为模式,通过我们的工作流以及开源的 SIMPLER 环境,促进了通用操作策略和模拟评估框架的研究。
May, 2024
通过在模拟环境中学习视觉运动策略,我们提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题,并在丰富的机器人操作任务中进行了基准测试。我们的方法在各种挑战性的操纵任务中取得了 93% 的成功率,并证明了模拟器训练的策略在真实场景中的视觉变化下具有更好的鲁棒性。
Jul, 2023