GeRM：一种混合专家四足机器人的通用模型

Mar, 2024

GeRM：一种混合专家四足机器人的通用模型

GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot

Wenxuan Song, Han Zhao, Pengxiang Ding, Can Cui, Shangke Lyu...

TL;DRGeRM 是一种多任务机器人学习方法，利用离线强化学习优化数据利用策略来从示范和次优数据中学习，通过引入专家混合结构解决有限的强化学习参数问题，并提供更快的推理速度和更高的模型容量，同时控制计算成本，在多任务学习中提高模型性能。通过一系列实验验证 GeRM 在所有任务上的优越性，并展示其在训练和推理过程中的效率，同时揭示其获取新技能的潜力。此外，我们还贡献了 QUARD-Auto 数据集，该数据集由自动收集，以支持我们的训练方法并推动多任务四足机器人学习的进展。这项工作为减少机器人数据收集成本和推动多任务学习社区的进步提供了一种新的范例。

Abstract

multi-task robot learning holds significant importance in tackling diverse and complex scenarios. However, current approaches are hindered by performance issues and difficulties in collecting training datasets. In this paper, we propose →

multi-task robot learning germ offline reinforcement learning mixture-of-experts quard-auto dataset

发现论文，激发创造

MT-Opt: 大规模连续多任务机器人强化学习

研究一种大规模集体机器人学习系统，可以同时获取多项行为并跨越不同任务，通过 MT-Opt 来学习广泛技能，并证明其在结构相似的新任务上可以泛化并且可以通过利用过去的经验更快地获取独特的新任务，从而提高系统的性能和功能。

Apr, 2021

多模态基于世界模型的通用型智能体

通过引入多模态基础世界模型，GenRL 代理学习框架能够将基础视觉语言模型的表示与生成式世界模型的潜在空间连接和对齐，从而克服了现有基础视觉语言模型在不同领域上的问题，并在多个运动和操作领域展现了强大的多任务泛化性能。此外，通过引入无数据强化学习策略，还为通用性的综合模型基于强化学习的全能代理奠定了基础。

Jun, 2024

RT-1：用于实际规模控制的机器人变压器

通过开放式训练和高容量结构的机器学习模型，结合具有各种数据多样性的大规模数据集，以实现机器人模型的泛化能力。

Dec, 2022

基于模型的高斯过程演示学习

本文提出了一种基于高斯混合回归的新型多输出高斯过程（MOGP）方法，利用 MOGP 的协方差将从演示中检索的变异性捕获起来，使机器人能够精确跟踪经过点，同时在高变异地区保持的柔顺性。

Oct, 2019

使用强化学习和生成式预训练模型实现四足机器人的逼真敏捷和游戏

通过使用动物和人类的知识来激发机器人创新，我们提出了一个框架，使四肢机器人能够在复杂环境中具备像真实动物一样的灵活性和策略。通过利用先进的深度生成模型产生模拟动物行为的运动控制信号，我们的方法通过预训练感知动物运动的生成模型，将原始知识保留并重复利用于环境适应性学习阶段，最终在复杂的下游任务中通过任务特定控制器解决任务，从而推动了机器人控制的前沿。

Aug, 2023

基于关键点集成的软动作者 - 评论高斯混合模型的机器人技能推广

我们通过将模仿和强化学习范式相结合，开发了一种学习和适应技能的混合模型，通过学习动态系统的关键点，利用机器人在技能学习过程中的视觉观察，预测场景内的参考点，从而实现机器人在新环境中的零样本泛化能力和在目标环境中更快地优化技能的目标，同时能有效处理场景变化。

Oct, 2023

VIMA: 多模态提示的通用机器人操作

使用多模态提示设计了一个基于转换器的通用机器人代理 (VIMA)，可以表达多种机器人操作任务，且在新颖的零激励泛化情况下优于先前的状态最优方法。

Oct, 2022

GIRA：高斯混合模型用于推理和机器人自主性

介绍了一种开源框架 GIRA，该框架通过紧凑的生成模型实现了基本的机器人算法，用于重建、姿势估计和占有建模。

Jun, 2023

GNM: 一种通用导航模型，以驱动任何机器人

本文研究了如何通过结构相似的多种机器人的数据来训练基于视觉的导航通用目标条件模型，并分析了有效数据共享的必要设计决策，证明了从异构数据集训练的普适策略优于任何单一数据集训练的策略。

Oct, 2022

GNFactor：通用神经特征场下的多任务真实机器人学习

用视觉观察来实现机器人在无结构的真实环境中执行多样化操作任务一直是机器人学领域的一个长期存在的问题。本文提出了 GNFactor，它是一个具有通用化神经特征场的多任务机器人操作的可视化行为复制代理系统，通过共享的深度三维体素表示，GNFactor 同时优化通用化神经场作为重建模块和 Perceiver Transformer 作为决策模块，以实现对 3D 场景的全面理解。

Aug, 2023