- HomeRobot: 开放词汇的移动操作
HomeRobot 是一种经济实惠的柔性机器人,可在家中导航和操作各种物品以完成日常任务,Open-Vocabulary Mobile Manipulation 是其面临的挑战,该文介绍了一个基于模拟的基准测试,使用强化学习和启发式模型等基 - Sonicverse: 面向具有视听能力的智能家居代理的多感官仿真平台
Sonicverse is a multisensory simulation platform for training household agents with audio-visual perception capabilities - 机器人操作中学习实际密集物体描述的模拟到真实转换
本研究提出了一种名为 Sim-to-Real Dense Object Nets (SRDONs) 的密集对象描述符,可实现从虚拟到真实环境的机器人物体识别一致性,并能够映射到一个统一的特征空间。在实验中,我们证明预训练的 SRDONs 可 - 强化学习中的策略转移的小样本图像到语义翻译
本研究探讨采用图像到语义翻译技术进行政策传递,缓解基于视觉的机器人控制代理的学习困难问题。通过学习从图像到语义的映射,我们可以将在模拟器中预先训练的政策传递到现实世界中,从而消除学习花费和风险高的现实世界上策略的实时交互学习。此外,使用图像 - 通过模拟与现实的迁移学习实现精准的无模型机器人抓取
提出了一种基于数据生成和模拟到真实世界迁移学习的机器人抓握框架,该框架通过减少模拟和实际之间的差距,解决了数据稀疏、传感器数据和接触模型不准确等问题,在单一物品、复杂形状物品和多物品的机器人抓握场景下分别获得了 90.91%、85.71% - CVPR基于基础模型反馈的政策调整
使用基於視覺和語言的模型的預先訓練模型作為演示解決方案,通過 Policy Adaptation from Foundation model Feedback(PAFF)技術可以在任務和環境不斷變化的情況下,創建可以實現分類、物體抓取和導航 - CPG-RL:四足动物步态中枢模式生成器的学习
本文提出了一种方法,将中心模式发生器(CPG),即振荡器系统,整合到深度强化学习(DRL)框架中,以产生稳健且全向的四足动物运动。模型直接调制内在振荡器设定点的振幅和频率,以及协调不同振荡器间的节律性行为,并可以使用 DRL 探索神经科学相 - ICLR在部分观测情况下,可证明的连续领域模拟到现实世界的转移
本文研究了在部分观测连续领域中的 Sim-to-real 转移,研究了使用线性二次高斯系统建模的仿真环境和真实环境,发现鲁棒对抗训练算法可以学习仿真环境下的策略,并相对于现实环境的最优策略非常具有竞争力。我们提出了一种针对无穷时间平均成本 - 学习低频运动控制,实现鲁棒和动态机器人运动
通过在真实机器人 ANYmal C 上执行 8-200Hz 的深度强化学习基于动作控制策略,我们展示了使用低频控制某种程度上可以实现比高频控制更加鲁棒和动态的机器人运动,这在不考虑动力学随机化或作用建模的情况下即可成功进行模拟到实物的转移。
- 学习和部署具有最小动力学随机化的健壮运动策略
通过引入随机力注入的策略,该研究为解决深度增强学习中数据收敛需求高问题提供了简单有效的方案,并成功将该方法用于四足机器人模拟模型到真实模型的转移。
- 利用深度强化学习从 3DOctree 观测中学习在月球表面抓取
此项研究探讨了使用深度强化学习对月球上基于视觉的机械臂进行抓取操作的智能化控制,通过虚拟环境的数据训练及域随机化技术,实现零样本迁移并成功验证实际机器人在类月环境中的操作效果。
- ACLWebShop: 面向可扩展的真实世界网络交互的基于场景语言智能体
通过开发一个模拟的电子商务网站环境,使用强化学习、模仿学习和预训练图像和语言模型训练和评估多种代理人,以便理解指令、购买商品并在嘈杂的网页中执行动作,并分析代理人和人类的轨迹以提供以后的思路。
- 通过强化学习实现快速移动
本篇论文提出一种端到端学习到的控制器,可为 MIT Mini Cheetah 机器猎豹在天然地形上实现最高时速 3.9m/s 的行动敏捷性,并且具有鲁棒性和抗干扰性。
- CVPRMetaSets: 基于点集的元学习用于泛化表示
本文提出了一种名为 MetaSets 的方法,通过元学习点云表示来解决点云通用表示的问题,并设计了两个基准用于三维点云的仿真到真实转移,实验结果表明 MetaSets 大大优于现有的三维深度学习方法。
- 基于流动策略的双手布料操作
本文提出了使用光流和 FabricFlowNet 等技术来解决布料操纵的问题,并通过仿真实现了单臂和双臂操作。最后,介绍了成功将该方法转换到 T-shirt 和矩形布料上的结果。
- 通过双目视觉使纯合成数据实现鲁棒性未知物体操作的 SimNet
提出了一种机器人感知的模拟到现实(sim-to-real transfer)方法,使用单个多头神经网络将模拟立体数据作为输入,输出模拟对象分割掩码、3D 定向边界框、对象关键点和视差等,通过学习过的立体子网络进行预测。该方法在机器人对未知对 - 学习布料平滑的可视连通性动态
通过学习基于粒子的动力学模型来实现机器人对布料的操作,该模型具有较强的归纳偏差和物理学习能力,同时具有视觉不变性和良好的预测可视化性。在仿真和现实场景下取得了优异的表现。
- DIRL: 面向 Sim-to-Real 转移的领域不变表示学习
该论文提出了一个领域不变表示学习算法,能够通过拟合联合概率分布并采用对抗学习减少不同领域之间的偏移,提高基于视觉深度学习的物体识别的表现以及在真实场景中的应用。
- 动态随机性重访:四足动物运动的案例研究
本研究旨在探讨动力随机化在学习鲁棒性步态的 Laikago 四足机器人中的作用,发现在 sim-to-real 转移任务中,不需要动力学随机化或机器人适应方案即可直接进行。在 sim-to-sim 设置中进行了大量消融研究,以了解影响政策鲁 - ICCVHypersim:一个逼真的室内全景场景综合数据集
本文介绍了一种名为 Hypersim 的、具备完整的室内场景计算机视觉理解的合成数据集,该数据集为场景、对象和像素级别提供完整的标注信息,并且评估了数据集的生成成本,并证明了使用该数据集进行预训练可以显著改善语义分割和 3D 形状预测任务的