机器人 VR 眼镜:基于实际到虚拟域适应的视觉控制
通过在模拟环境中学习视觉运动策略,我们提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题,并在丰富的机器人操作任务中进行了基准测试。我们的方法在各种挑战性的操纵任务中取得了 93% 的成功率,并证明了模拟器训练的策略在真实场景中的视觉变化下具有更好的鲁棒性。
Jul, 2023
本论文提出了基于深度神经网络的强化学习在机器人抓取任务中的应用,以及利用生成模型进行图像仿真与真实环境之间的过渡。其中引入了 RL-scene 一致性损失用于图像翻译,可保证翻译操作是不变的,并在实现无监督领域转换的同时,训练出了 RL-CycleGAN 模型,该模型表现出了模拟到现实环境下最优的效果。
Jun, 2020
探究了一种称为 “Domain Randomization” 的技术,该技术使用非真实随机纹理来训练深度神经网络对象定位器,使得该定位器在真实环境中表现出色,并且可以应用于机器人控制中。
Mar, 2017
本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景,包括不同方向的方法和应用场景,重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。
Sep, 2020
为解决机器人虚拟世界到真实世界的迁移问题,本文提出了一种基于模块化架构、采用语义图像分割作为元表示的深度强化学习方法,实现了 RGB 图像到语义图像段转换。实验结果表明,该架构在避障和目标跟踪任务中表现优异,并在虚拟和真实环境中均明显优于基准方法。
Feb, 2018
提出了一种新颖的领域适应方法,将在大型易于获得的源数据集 (例如,合成图像) 上学习的视觉表示适应到目标实际世界领域,不需要昂贵的手工数据注释。作者使用弱对齐图像,结合分布对齐的方式来解决实际和模拟环境差异的问题,并在机器人操作任务上对其进行了评估。
Nov, 2015
本论文提出了一种基于元学习的方法,在使用任务特定轨迹生成模型提供动作空间以便快速探索的同时,训练机器人智能体以适应各种动态条件,以解决现代强化学习方法低样本效率和不安全探索的问题。我们通过在仿真环境中进行域适应并分析适应过程中潜在空间的结构来评估该方法。然后,在 KUKA LBR 4 + 机器人上应用此策略,并在将曲棍球击向目标的任务中评估其性能。实验结果表明,与基准表现相比,这种方法具有更一致和稳定的域适应性,从而获得了更好的整体性能。
Sep, 2019
该研究提出了一种有效的深度学习机器人抓取小圆球的方法,并将整个系统分解为视觉模块和闭环控制器模块两部分来实现。通过在真实背景图像和模拟图像之间进行有效领域转移来训练视觉模块,并使用模仿学习在仿真环境中对闭环控制器进行训练,从而实现了对未知情况的抓取成功率达到了 90%。
Dec, 2017
提出了一种基于模型的强化学习策略,通过训练可转移机器人感知的世界动力学模型和机器人特定的动力学模型,从而利用以前在其他机器人上收集的数据来减少对机器人特定数据的需求,并在模拟和实际机器人上实现了视觉控制任务上的零泛化
Jul, 2021