基于无模型强化学习的乒乓球机器人

Mar, 2020

基于无模型强化学习的乒乓球机器人

Robotic Table Tennis with Model-Free Reinforcement Learning

Wenbo Gao, Laura Graesser, Krzysztof Choromanski, Xingyou Song, Nevena Lazic...

TL;DR通过控制机器人关节以 100Hz 的速度返回乒乓球，我们提出了一种模型无关的算法，并证明了进化搜索方法能够在非视觉输入和时间之间卷积的基础上作用于基于 CNN 的策略体系结构，学习紧凑的控制器，在适当调整任务和奖励的情况下，策略能够发展多模态样式，同时在广泛的球类投掷范围内实现 80％的回球率，观察到多模性不需要任何建筑先验知识。

Abstract

We propose a model-free algorithm for learning efficient policies capable of returning table tennis balls by controlling robot joints at a rate of 100Hz. We demonstrate that →

model-free algorithm table tennis evolutionary search cnn-based policy architectures multi-modal styles

发现论文，激发创造

使用肌肉机器人从零开始学习乒乓球

本文介绍一种利用气动人工肌肉和强化学习来安全地训练机器人学习打乒乓球的方法，同时演示了这种方法可以让机器人在高速运动下实现回球和攻击

Jun, 2020

机器人乒乓球：高速学习系统案例研究

该篇论文深入研究了一个真实世界的机器人学习系统，该系统能够和人类进行数百次乒乓球对打，并能够精确地将球返回到指定目标。论文提供了完整的系统描述，包括通常不广泛传播的设计决策，并附上一系列研究，澄清了减轻潜在延迟来源的重要性，考虑训练和部署分布变化的影响，感知系统的稳健性，策略超参数的敏感性以及行动空间的选择。

Sep, 2023

多模态乒乓球机器人系统

基于高准确度视觉检测和快速机器人反应的改进型乒乓球机器人系统，通过多模态感知系统的创新校准方法实现了对旋转估计至关重要的精确度更高的旋转估计方法，并展示了结合基于事件的摄像头和脉冲神经网络（SNN）输出进行准确球检测的方法。

Oct, 2023

通过深度强化学习从自我中心视觉中学习机器人足球

我们运用多智能体深度强化学习（RL）通过自我中心的 RGB 视觉训练端到端的机器人足球策略，解决了现实世界机器人领域中的许多挑战，包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端多智能体机器人足球的训练，并能够在真实世界中部署。

May, 2024

关于团队运动比赛中的多智能体学习

本文提出了一种分层训练智能体的方法，以期在团队运动游戏中实现类似于人类的风格和高水平的表现，初步结果显示所提出的方法具有解决多智能体学习问题的潜力。

Jun, 2019

同时学习视觉和基于特征的控制策略，应用于现实世界的杯中球游戏

通过多任务强化学习方法，本文在真实机器人上实现了视觉导向控制策略的快速训练技术，并在模拟和真实世界的 Ball-in-a-Cup 游戏中进行了测试。

Feb, 2019

模型为基础的深度强化学习在空气曲棍球中的应用

开发自动打冰球策略的研究，使用基于模型的深度强化学习结合自我对抗学习，解决了智能机器人对于不同对手策略的泛化和过拟合问题。同时探讨了想象力视域对于机器学习效果的影响。

Jun, 2024

基于视觉的机器人抓取的深度强化学习：一种离线策略方法的仿真比较评估

本文研究基于视觉的机器人抓取中的深度强化学习算法，提出了一个模拟的基准测试对齐机器人抓取任务，评估了基准测试任务的不同 Q 函数估计方法，结果表明简单方法可以成为流行算法的强有力竞争对手，此外还阐明了算法的相对权衡

Feb, 2018

深度视觉预见性规划机器人动作

本论文提出一种基于无标注训练数据的方法，结合深度动作条件视频预测模型和模型预测控制，使真实机器人能够进行非抓取操作，比如推动物体，并且可以处理训练过程中没有出现过的新物体。

Oct, 2016

机器人空气曲棍球：用强化学习进行机器人学习的操纵测试平台

机器人空中曲棍球动态交互的强化学习实验平台，包括从简单的任务到复杂的任务，支持模拟到真实世界的迁移，并使用演示数据评估了行为克隆、离线强化学习和从零开始的强化学习。

May, 2024