QuadrupedGPT：开放式环境中的多功能四足机器人代理

Jun, 2024

QuadrupedGPT：开放式环境中的多功能四足机器人代理

QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds

Ye Wang, Yuting Mei, Sipeng Zheng, Qin Jin

TL;DR通过有效利用多模态观测以及发展高级认知能力，QuadrupedGPT 是一种灵活性与宠物相当的多功能机器人，能够掌握广泛的复杂任务，并解决长期目标的执行问题。

Abstract

While pets offer companionship, their limited intelligence restricts advanced reasoning and autonomous interaction with humans. Considering this, we propose quadrupedgpt, a versatile agent designed to master a br

pets quadrupedgpt agility multimodal observations long-term objectives

发现论文，激发创造

RoboGPT：为日常指令任务做出智能长期决策的智能代理

在这篇研究论文中，我们提出了一种名为 RoboGPT 的机器人代理，通过两个模块（基于 LLMs 的规划与重新规划，以及专为子目标设计的 RoboSkill）来完成日常任务的具体决策。我们使用了一份新的机器人数据集和 RoboGPT 来增强基于 LLMs 的规划，并成功在诸多任务中超越了目前的最先进方法。

Nov, 2023

DeepGait: 使用深度强化学习规划和控制四足步态

本文提出了一种新的神经网络政策训练技术，可用于在非平坦地形上的足式机器人的运动规划和控制。该方法结合了模型驱动的运动规划和强化学习的最新方法，并应用于一组包含挑战性地形场景的模拟测试中，证明了该方法的有效性。

Sep, 2019

使用强化学习和生成式预训练模型实现四足机器人的逼真敏捷和游戏

通过使用动物和人类的知识来激发机器人创新，我们提出了一个框架，使四肢机器人能够在复杂环境中具备像真实动物一样的灵活性和策略。通过利用先进的深度生成模型产生模拟动物行为的运动控制信号，我们的方法通过预训练感知动物运动的生成模型，将原始知识保留并重复利用于环境适应性学习阶段，最终在复杂的下游任务中通过任务特定控制器解决任务，从而推动了机器人控制的前沿。

Aug, 2023

元 GPT: 多智能体协同框架的元编程

MetaGPT 是一种创新的框架，将有效的人类工作流作为元编程方法融入到 LLM 驱动的多智能体协作中，以便有效地解决复杂的多智能体协作问题，并在协作软件工程任务上实现了高一致性的全面解决方案。

Aug, 2023

Sim-to-Real: 四足机器人学习敏捷运动

本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统，能够从简单的奖励信号中学习四足运动，并可提供开环参考进行学习过程的控制，采用系统辨识来改进物理模拟器，利用物理环境随机与扰动设计控制器，并在物理模拟器中进行评估，成功在现实世界中部署。

Apr, 2018

通过操纵学习行走：在动态环境中的感知四足动力学

本文介绍了一个名为 PRELUDE 的层级学习框架，其中包括高层决策和低层步态生成。在该框架中，高层导航控制器用人类演示进行了模仿学习，而低层步态控制器则使用强化学习获得多样化的步态。该方法在仿真和硬件实验中表现出色。

Sep, 2022

通过相位引导控制器学习四足机器人的自由步态转换

本文提出了学习控制犬形四足机器人在各种步态下运动的框架，并通过强化学习算法解决了多任务学习的问题。使用四个独立的相位来描述步态发生器和控制策略之间的接口，使用该控制策略，黑豹四足机器人可以在自然环境下流畅、稳健地学习所有运动技能并遵循速度命令进行运动。

Jan, 2022

GPT-4V 是一种通用的互联网代理系统，具有视觉能力

本文研究了大型多模态模型 (LMMs)，特别是 GPT-4V (ision) 和 Gemini 的最新进展，扩展了多模态模型的能力边界，超出了传统任务如图像标题生成和视觉问答。我们提出了 SEEACT，一种利用 LMMs 的通用网络代理，可以根据自然语言指令在任何给定的网站上完成任务。通过在最新的 MIND2WEB 基准上进行评估，我们展示了 GPT-4V 在网络代理中的巨大潜力，如果我们将其文本计划手动转化为网站上的动作，它可以成功完成 50% 的任务，这大大优于仅针对网络代理进行优化的纯文本 LLMs，如 GPT-4 或更小的模型 (FLAN-T5 和 BLIP-2)。然而，转化仍然是一个主要的挑战，现有的 LMM 转化策略，如集合标记提示，并不适用于网络代理，而我们在本文中开发的最佳转化策略利用了 HTML 文本和视觉信息。然而，与理想转化仍然存在相当大的差距，这给进一步改进留下了充分的空间。

Jan, 2024

MTAC：基于层次强化学习的多足可适应地形控制器

城市搜救和救援任务需要快速的第一反应，以减少生命和财产的损失。我们提出了一种多步态的地形自适应控制器（MTAC）来应对四足机器人在动态和崎岖地形环境中的挑战。通过使用层次强化学习的方法，我们证明了该方法在各种环境下的扩展性和计算时间与最先进方法相当。

Nov, 2023

GPT 循环：多智能体系统的自适应决策

通过融合 Generative Pre-trained Transformers (GPT) 这类大型语言模型的高级推理能力和 Multiagent (MAS) 系统，这篇论文介绍了一种新的方法，“GPT-in-the-loop”，用于增强问题解决和解释能力。结合智能街灯物联网应用背景，该方法使代理人通过传感器、执行器和神经网络创建出一个能耗更低的照明系统，并与传统神经进化方法和软件工程师提供的解决方案进行了比较，凸显了 GPT 驱动的 Multiagent 系统在物联网中的潜力。

Aug, 2023