通用流程作为可扩展机器人学习的基础支持

Jan, 2024

通用流程作为可扩展机器人学习的基础支持

General Flow as Foundation Affordance for Scalable Robot Learning

Chengbo Yuan, Chuan Wen, Tong Zhang, Yang Gao

TL;DR提出了一种基于预测流的机器人学习方法，能够实现在现实场景中稳定且高效的技能转移，涵盖了现实环境中的多个目标类别，通过利用大规模数据集实现了可扩展的普适机器人学习。

Abstract

We address the challenge of acquiring real-world manipulation skills with a scalable framework.Inspired by the success of large-scale auto-regressive prediction in Large Language Models (LLMs), we hold the belief that identifying an appropriate prediction target capable of leveraging l

real-world manipulation skills robot learning flow prediction scalable data resources skill transfer

发现论文，激发创造

深度视觉预见性规划机器人动作

本论文提出一种基于无标注训练数据的方法，结合深度动作条件视频预测模型和模型预测控制，使真实机器人能够进行非抓取操作，比如推动物体，并且可以处理训练过程中没有出现过的新物体。

Oct, 2016

FlowBot3D：学习 3D 关节流来操纵关节对象

采用基于视觉的系统和神经网络，我们提出了一种使用密集的向量场来预测各种关节物体的潜在运动的方法，并在此基础上展开手部的运动规划用于操纵各种对象，实验结果表明该系统在模拟和现实世界中均取得了最优良好的表现。

May, 2022

铺路把握一切：将基础模型转移，用于通用拾放机器人

本文提出了一种基于语言根据分割掩模的新型范例，来应对日常情况下一系列的抓取和放置机器人操作任务，通过将从掩模中传达的精确语义和几何形状与我们的多视点策略模型相结合，使我们的方法能够感知准确的物体姿态并实现样本高效学习。

Jun, 2023

基于基础模型的人机协同持续机器人学习

通过使用基于大型语言模型的规划器，我们克服了当前固定技能集的限制，提出了一种用于数据和时间高效教授机器人这些技能的方法，该系统可以重复使用新习得的技能，展示了开放世界和终身学习的潜力。

Sep, 2023

从人类视频中构建结构化世界模型

我们提出了一种方法，通过仅利用许多不同设置的少量实际交互轨迹，使机器人能够有效地学习操纵技能，并由此建立了一个基于人的视频的结构化行为空间，从而使不同的机器人能够在复杂环境下学习各种操纵技能。

Aug, 2023

RegFlow: 未来预测的概率流回归

本文提出了一种弹性且鲁棒的概率框架 RegFlow，采用超网络架构和连续正常化流模型进行训练，无需对未来状态的单峰性或概率分布做出任何限制，成果在多项基准数据集上表现优于竞争方法。

Nov, 2020

利用视觉可供性在非结构化数据上进行语言基础建设

本文提出了一种基于视觉语言感知模型的新方法，可以在真实世界中从非结构化、离线、无需重置的数据中高效地学习通用的、以语言为条件的机器人技能，实验表明该方法配合 LLMS 可以在真实世界中完成长期、多层次的任务，并比以往方法少使用一个数量级的数据。

Oct, 2022

真实世界点云的可伸缩场景流

本文介绍一种新的基于运动跟踪的大规模数据集并提出适用于全点云的 FastFlow3D 架构，以更好地进行场景流预测并提高现实世界的表现。

Mar, 2021

RT-1：用于实际规模控制的机器人变压器

通过开放式训练和高容量结构的机器学习模型，结合具有各种数据多样性的大规模数据集，以实现机器人模型的泛化能力。

Dec, 2022

GenFlow: 适用于新颖物体 6D 姿势细化的通用循环流

GenFlow 通过引导目标物体的形状信息，实现了对新物体的精确性和泛化能力的最佳结合。通过预测渲染图像与观察图像之间的光流并迭代优化 6D 姿态，通过三维形状限制和从端到端可微分系统中学习的通用几何知识，性能得到了提升。通过设计级联网络体系结构来利用多尺度相关性和从粗到细的精化，GenFlow 在既有 RGB 和 RGB-D 情况下在看不见的物体姿态估计基准测试中排名第一，在已知物体姿态估计中也能与现有最先进的方法相当。

Mar, 2024