本文介绍了一种简单的方法来解决在模拟训练中的现实差距问题。通过在训练过程中随机化模拟器的动力学,我们能够开发出适应非常不同的动力学的策略,并且使其在真实世界中推广而不需要在物理系统上进行训练。在机器人控制方面,我们的方法在物体推动任务上表现出了很好的性能。
Oct, 2017
探究了一种称为 “Domain Randomization” 的技术,该技术使用非真实随机纹理来训练深度神经网络对象定位器,使得该定位器在真实环境中表现出色,并且可以应用于机器人控制中。
Mar, 2017
本文提出了一种 Bayesian Domain Randomization(BayRn)算法,通过采样真实世界目标域中的稀疏数据来适应性地调整源域分布参数,解决在机器人控制中遇到的模拟培训与真实世界之间存在的不匹配问题,实现了在模拟和真实环境下的任务优化。
Mar, 2020
本文提出并分析了一种基于任务导向探索的框架,该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数,并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明,任务导向的探索有助于在系统参数未知时,使基于模型的策略适应更好,从而实现更好的任务表现。
Jun, 2020
通过在模拟环境中学习视觉运动策略,我们提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题,并在丰富的机器人操作任务中进行了基准测试。我们的方法在各种挑战性的操纵任务中取得了 93% 的成功率,并证明了模拟器训练的策略在真实场景中的视觉变化下具有更好的鲁棒性。
Jul, 2023
本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景,包括不同方向的方法和应用场景,重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。
Sep, 2020
本研究定义了一种易于重现的实验设置,用于比较四种随机化策略及三种随机参数在仿真和实验机器人上完成的任务。研究发现,完全随机生成仿真和精细调整策略可以更好地转移到现实机器人,并且比其他测试方法更有差异化的结果。
Jun, 2022
本文提出了一种基于模拟场景的策略转移方法,通过改变模拟参数分布并结合少量真实世界回合的训练,以实现在不同机器人任务中的可靠策略转移。
Oct, 2018
本文探讨在模拟环境中学习机器人操作策略的方法,通过使用深度图像数据的随机扩增策略,实现了在非真实场景下学习并获得了验证。
Mar, 2019
我们提出了一种使用未配对数据学习领域之间状态和动作空间的映射函数的新方法,通过对过渡效果进行对称优化结构的方案,将机器人策略从源领域无缝转移到目标领域,实现了对于不同状态和动作空间的机器人之间的迁移学习和显著降低对齐误差的方法。
Mar, 2024