DexDribbler: 通过动态监督学习器的熟练足球操纵

Mar, 2024

DexDribbler: 通过动态监督学习器的熟练足球操纵

DexDribbler: Learning Dexterous Soccer Manipulation via Dynamic Supervision

Yutong Hu, Kehan Wen, Fisher Yu

TL;DR为了处理不同的地形和模仿智能行为，学习四肢机器人熟练行走策略变得越来越受欢迎。尽管对于人类和智能动物来说这是一种自然行为，但在学习社区中，对于操纵移动物体和通过腿部进行运动（如踢足球）的联合操作却受到了少量关注。解决这个多任务问题的关键挑战是根据操纵对象的状态和目标来推断行走的目标，这两者之间的隐含关系很难直接从训练经验中捕捉。我们提议添加一个反馈控制模块，以准确计算所需的身体级运动，并将输出作为关节级行走监督显式地使用。我们进一步利用改进的球体动态模型、扩展的上下文辅助估计器和综合的球体观察器来促进将在仿真中学习的策略转化到现实世界中。我们观察到我们的学习方案不仅可以使策略网络更快地收敛，还可以使足球机器人在平坦表面上执行精巧的运动，如急转弯和转向，这是以前方法所缺乏的。视频和代码可在此网址获得。

Abstract

Learning dexterous locomotion policy for legged robots is becoming increasingly popular due to its ability to handle diverse terrains and resemble intelligent behaviors. However, joint manipulation of moving

dexterous locomotion policy joint manipulation objects feedback control block soccer robots

发现论文，激发创造

DribbleBot: 野外动态腿部操控

DribbleBot 是一种腿式机器人系统，通过强化学习在模拟环境中训练并将其转移到现实世界中，在不同地形和使用机载相机感知球的约束条件下，实现类似人类的足球运动控制，证明四足机器人平台适用于从感知观察中直接控制动态全身运动与操作的研究。

Apr, 2023

使用四足机器人进行分层强化学习，掌握精确的足球射门技巧

本文提出了一种层次化的框架，利用深度强化学习使四足机器人能够在现实世界中执行精确的射击技能，包括鲁棒的运动控制策略和运动规划策略，应用于 A1 四足机器人中，实现了将足球精确射向目标的目的。

Aug, 2022

使用深度强化学习为双足机器人学习敏捷的足球技能

本文研究了深度强化学习在机器人学中的应用，通过模拟训练，在低成本仿真机器人上实现了动态环境下复杂足球比赛中从走路到踢球等一系列动作表现出稳定流畅的运动技能，并取得了不错的效果。

Apr, 2023

使用强化学习创建动态四足机器人守门员

我们提出了一个基于强化学习的框架，使得四足机器人在真实世界中执行足球门将任务。

Oct, 2022

通过深度强化学习从自我中心视觉中学习机器人足球

我们运用多智能体深度强化学习（RL）通过自我中心的 RGB 视觉训练端到端的机器人足球策略，解决了现实世界机器人领域中的许多挑战，包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端多智能体机器人足球的训练，并能够在真实世界中部署。

May, 2024

学习四肢机器人灵活动态技能

通过在仿真中训练神经网络策略并将其转移到现实的四足动态平衡系统，研究创造了一种快速、自动且高效的数据生成方案，从而实现了在四足机器人技能方面的进一步提升。

Jan, 2019

ViViDex: 从人类视频中学习基于视觉的灵巧操纵

我们的研究旨在通过学习一种统一的基于视觉的策略，使多指机械手能够在各种姿势下操纵不同的物体。我们提出了一种新的框架 ViViDex，通过使用强化学习和轨迹引导奖励训练每个视频的基于状态的策略，从而获得视觉自然且物理可行的轨迹，并在不使用任何特权信息的情况下训练出一个统一的视觉策略，该方法通过坐标转换方法显著提升了性能，在三个灵巧操纵任务上展示出了较大的改进。

Apr, 2024

从经验和模仿中学习灵巧的操作策略

本研究探索了学习控制方法对于机械手进行非抓握性操作的影响，通过深度学习和最近邻等方法实现了控制器的泛化。研究表明仅基于时间轨迹的控制器仅需要少量训练数据即可构建，同时多个控制器可以进行插值形成更全局的控制器。

Nov, 2016

DexDLO: 学习针对性目标的动态变形线性物体的巧妙操作策略

Deformable linear object manipulation using an anthropomorphic hand is explored through the DexDLO framework, which learns dexterous dynamic manipulation policies and performs various tasks such as grabbing, pulling, and end-tip position control, demonstrated through the Mujoco physics simulator.

Dec, 2023

深度全身控制：学习一体化的操作和运动策略

提出使用增强学习学习整体控制策略来实现对四肢机器人的控制，以解决四肢协调和模块间错误传播的问题，该统一策略可在多种任务设置中展示动态和敏捷行为。

Oct, 2022