- ECCV照片逼真的神经域随机化
本文提出一种基于神经网路的实验数据生成方法,通过不同的网络模块随机组合生成高质量的逼真图像,应用于对象检测和单目深度估计等领域,在实现真实世界转化时,性能明显优于目前主流的方法。
- MM量化先于选择:活跃动态偏好在强化学习中的鲁棒性
通过引入主动动态偏好方法(Active Dynamics Preference),对系统随机参数进行有效选择,并在四个机器人运动任务中进行验证,表明此方法具有超强的适应性和鲁棒性,可有效提高机器人环境下的一致性。
- 加速机器人学习接触丰富的操纵:一个课程学习研究
本研究结合课程学习和域随机化方法,探究如何快速应用于机器人接触式操作任务中,实现在工业装配等领域中的快速学习和短时间内达到高成功率。研究结果表明,本文所提出的方法在工业插入任务中取得了最多 86% 的成功率,并且使用样本训练的时间不到以往的 - 领域随机化在物体计数中的应用
本文提出一种使用基于合成数据集的域随机化方法进行物体计数的方法,避免了昂贵的 3D 艺术家手动生成照片般逼真的数据集,增加了数据集的多样性和泛化性,实现了较好的性能表现。
- 可塑性代理程序用于可重构机械机械臂
本文提出一种基于深度强化学习和序列神经网络的学习代理,应用于多连杆机械臂的不同配置。通过领域随机化方法进行训练,演示了该网络在 2D N-Link 机械臂上的泛化能力。
- KDDDropout 的梦幻之地:从学习模拟器到现实的泛化
本研究探索从梦境环境到真实环境的通用方法 Drean2Real。借鉴于领域随机化,结合使用丢失(Dropout)技术,我们使用具有可配置参数的世界模型训练来创建多样的梦境环境,提高控制器从神经网络梦境环境到现实环境转移的能力,并证实了丢失梦 - CVPR频率空间域随机化 —— 域泛化
本文提出了一种基于频率空间领域随机化的方法(FSDR),通过将图像分解成不变频率成分(DIFs)和变异频率成分(DVFs)进行随机化,实现了更可控的域随机化过程,并在多个领域泛化任务上展示了优异的分隔性能。
- CVPR通过域随机化和元学习持续调整视觉表示
本文提出了一种基于域随机化和元学习的方法,通过对视觉域进行重构以及加入正则项的方式来提高模型的鲁棒性,从而减少在不同领域中的遗忘现象。
- 有效的 Sim2Real 迁移干预设计
本文旨在通过因果推断的角度解释环境干预在域随机化和数据增强中的优越性,并将其作为培养对不相关特征不变性的手段。研究发现,通过在真实世界存在变化的维度中展示具有相似变化的干扰,可以提高学习算法对其它干扰的鲁棒性并提高模拟环境转移的泛化能力。
- 软数据增强在强化学习中的泛化
本文提出了 SOft Data Augmentation(SODA)方法,通过在编码器上施加约束,最大化增强和非增强数据的潜在表示之间的互信息,从而提高强化学习的样本效率、泛化能力和稳定性,实验表明该方法显著优于最先进的基于视觉的 RL 方 - 从 THEODORE 学习:用于深度迁移学习的合成全景室内顶视数据集
本文介绍一个新的大规模室内合成数据集 THEODORE,包含 100,000 张物体的高分辨率多样化鱼眼图像,附带语义分割、实例掩模和物体检测任务的边界框注释,通过图像合成和域随机化高度泛化我们的模型,AP 可达 0.84
- 视觉语言导航的模拟与实际转化
本文旨在研究如何将视觉 - 语言导航技术 (VLN) 从模拟场景应用于物理机器人,并提出了使用子目标模型和领域随机化等方法,以提升在未知环境下的表现。作者在 325 平方米的办公室内进行实验,结果表明,在提前采集和注释了占用图和导航图的情况 - 机器人深度强化学习中的模拟到真实转移:一项调查
本篇综述涵盖了深度强化学习中模拟转真实环境的基本背景,包括不同方向的方法和应用场景,重点讨论了域随机化、域自适应、模仿学习、元学习和知识蒸馏等方法及其存在的机遇和挑战。
- 使用对抗种群的鲁棒强化学习
利用强化学习中的对抗噪音和以聚集对手人口作为训练方法,改善了机器人领域中强化学习中的鲁棒性和泛化性能。
- SIGIR交互式信息检索中的强化学习训练经验平衡
本论文利用领域随机化方法针对强化学习与交互式信息检索技术之间的样本低效性问题,提高其学习效率并在 TREC Dynamic Domain (DD) 2017 跑道实验中,有效地提高 RL 智能体在处理未见过情况时的效能 22%。
- 基于贝叶斯优化的高效领域随机化
本文提出了一种 Bayesian Domain Randomization(BayRn)算法,通过采样真实世界目标域中的稀疏数据来适应性地调整源域分布参数,解决在机器人控制中遇到的模拟培训与真实世界之间存在的不匹配问题,实现了在模拟和真实环 - 长视角复杂操作任务的 IKEA 家具组装环境
本研究介绍了 IKEA 家具组装环境,旨在测试自动化复杂操作任务的效率。此环境支持 80 多种不同的家具模型,并公开提供,可用于解决复杂操纵任务的方法测试。
- 无需演示学习可变形物体操纵
本文介绍了基于无模型视觉强化学习的变形物体操作问题,通过提出迭代的拾取 - 放置空间和只显式学习放置策略来加速学习,并使用 MVP 选择策略,此学习框架在变形物体操纵任务方面获得了比独立空间快一个数量级的学习,并使用领域随机化将策略转移到 - ICCV领域随机化和金字塔一致性:无需访问目标域数据的模拟到实际泛化
本文提出一种使用模拟技术进行自动驾驶场景语义分割的方法,通过域泛化的方式进行测试并实现了高度通用性,其中使用了域随机化和金字塔一致性两种技术,实现了域不变的特征表示。经过在 GTA,SYNTHIA 到 Cityscapes,BDDS 和 M - DoorGym:可扩展的开门环境和基准智能体
该篇文章介绍了 DoorGym 环境模拟框架,利用强化学习与领域随机化提高模型泛化性能。提供的基于 PPO 和 SAC 的实现可成功地在 DoorGym 环境中打开不同类型的门,并且现实世界中的转移实验也证明了训练出的模型的可用性。