利用局部性提高机器人操作中的样本效率

Jun, 2024

利用局部性提高机器人操作中的样本效率

Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation

Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao

TL;DRSGRv2 是一种通过改进视觉和动作表示来提高样本效率的模仿学习框架，其中关键的归纳偏置 - 动作局部性假设认为机器人的动作主要受目标物体及其与局部环境的交互影响。在模拟和真实环境中进行的广泛实验证明了动作局部性对提高样本效率的重要性。SGRv2 在 RLBench 任务中使用仅 5 个演示并在 26 个任务中超过 RVT 基线，同时在 ManiSkill2 和 MimicGen 中的稠密控制下与 SGR 相比，成功率提高了 2.54 倍。在真实环境中，仅使用八个演示，SGRv2 可以以显著更高的成功率执行各种任务，相比基线模型。

Abstract

Given the high cost of collecting robotic data in the real world, sample efficiency is a consistently compelling pursuit in robotics. In this paper, we introduce SGRv2, an imitation learning framework that enhanc

sample efficiency imitation learning action representations inductive bias-action locality robotics

发现论文，激发创造

视觉模仿的简易实现

本研究提出了一种基于商用机械臂的可行的、简化了数据收集过程的、能够有效采集各种复杂场景演示数据的人机互动界面，并采用了多项数据增强技术来优化模型的学习性能，最终在非捏取推动和物品堆叠等任务中获得了较高的成功率。

Aug, 2020

基于模拟运动演示的机器人操纵强化学习

本文提出了一种新的机器人操作方法，该方法利用了物体本身的运动学习，通过使用物理模拟器中的对象运动策略生成辅助奖励，称为模拟运动演示奖励（SLDRs），该方法可以在不需要人类演示或昂贵成本的情况下，通过强化学习来掌握机器人操作技能，从而实现多物体堆放和非刚性物体操作等任务的更高成功率和更快学习。

Oct, 2019

GVCCI: 语言引导下的机器人操作视觉理解的终身学习

本篇论文提出了 GVCCI，一种基于生动地场景生成指引的视觉定位无监督学习框架，该框架通过利用生成的数据持续学习视觉定位模型，并在语言引导机器人操作方面取得了良好的效果。

Jul, 2023

机器人操控的语义增强和动作分块的泛化和效率

通过语义增强和行为表征，我们开发了一个高效的系统（RoboAgent）来训练具备多任务操作技能的通用智能体，使用少量多样的多模态数据集，能够展示不同的技能并在新颖的场景中表现出很好的泛化性能。

Sep, 2023

机器人操作的通用语义几何表现

本文提出一种名为语义几何表征（SGR）的感知模块，旨在整合 RGB 和深度相机的信息，以更好地学习机器人感知和控制的表征，实验结果表明，SGR 在单任务和多任务设置下的表现均显著优于其他方法，并具有到新语义属性的泛化能力。

Jun, 2023

采用分层式 Sim2Real 实现的多智能体运动操控

采用强化学习方法通过层次性模拟实现在多移动机器人协作下的操纵行为。

Aug, 2019

基于 GPU 仿真和高质量演示的交互式人类样学习加速

利用 GPU 模拟技术和模仿学习指导策略搜索以使强化学习培训可在高维机器人手表现复杂控制问题的领域中成为可能，最终演示了并行强化学习和模仿学习的互补优势和优秀的验证结果。

Dec, 2022

RREx-BoT：用技巧袋处理远程代指表达式

该研究揭示家庭机器人在执行长期任务时通过使用三维编码和视觉语言模型可实现客观目标定位；通过实证研究，该研究表明该方法优于以往的同类工作并适用于实际机器人平台。

Jan, 2023

Gen2Sim：用生成模型在仿真中扩展机器人学习规模

利用图像扩散模型生成 3D 资产并查询语言和视觉生成模型，通过自动化生成任务描述、任务分解和奖励函数，实现在模拟环境中扩大机器人技能学习的方法。该方法成功地实现了多样性长期任务的策略学习，为模拟中的机器人技能获取迈出了一步。

Oct, 2023

基于模型的视觉演示逆强化学习

本文介绍了一种基于梯度的反向强化学习框架，利用预训练的视觉动态模型从视觉人类演示中学习成本函数，并通过视觉模型预测控制来复制演示行为，以解决机器人操作中的未知动力学等问题。我们在两个基本的对象操作任务上评估了我们的框架。

Oct, 2020