模型为基础的深度强化学习在空气曲棍球中的应用

Jun, 2024

模型为基础的深度强化学习在空气曲棍球中的应用

Learning to Play Air Hockey with Model-Based Deep Reinforcement Learning

Andrej Orsula

TL;DR开发自动打冰球策略的研究，使用基于模型的深度强化学习结合自我对抗学习，解决了智能机器人对于不同对手策略的泛化和过拟合问题。同时探讨了想象力视域对于机器学习效果的影响。

Abstract

In the context of addressing the robot air hockey challenge 2023, we investigate the applicability of model-based deep reinforcement learning to acquire a policy capable of autonomously playing air hockey. Our ag

robot air hockey challenge model-based deep reinforcement learning autonomous air hockey playing self-play imagination horizon

发现论文，激发创造

机器人空气曲棍球：用强化学习进行机器人学习的操纵测试平台

机器人空中曲棍球动态交互的强化学习实验平台，包括从简单的任务到复杂的任务，支持模拟到真实世界的迁移，并使用演示数据评估了行为克隆、离线强化学习和从零开始的强化学习。

May, 2024

冰球中基于上下文的球员评估的深度强化学习

本论文提出了一种基于深度强化学习（DRL）的新方法来捕捉游戏背景，该方法使用 3M NBA 比赛的 play-by-play 事件来学习一个行动价值 Q 函数，并引入一种新的游戏影响度量（GIM）来评估玩家的整体表现。评估结果表明，GIM 在整个赛季中保持一致，并与标准成功指标和未来薪资高度相关。

May, 2018

使用深度强化学习为双足机器人学习敏捷的足球技能

本文研究了深度强化学习在机器人学中的应用，通过模拟训练，在低成本仿真机器人上实现了动态环境下复杂足球比赛中从走路到踢球等一系列动作表现出稳定流畅的运动技能，并取得了不错的效果。

Apr, 2023

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

通过深度强化学习从自我中心视觉中学习机器人足球

我们运用多智能体深度强化学习（RL）通过自我中心的 RGB 视觉训练端到端的机器人足球策略，解决了现实世界机器人领域中的许多挑战，包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端多智能体机器人足球的训练，并能够在真实世界中部署。

May, 2024

通过自我博弈学习多智能体协商

这篇论文通过深度强化学习中的自我对战迭代程序展示了如何创建越来越多样化的交通场景并学习多智能体协作策略提高合并操作成功率。

Jan, 2020

异步离线更新下的机器人操作深度强化学习

本文介绍一种基于深度 Q 函数算法的深度强化学习方法，能够实现在真实的物理机器人上进行复杂的 3D 操作任务学习，并通过多个机器人异步汇聚优化策略更新等技术进一步提高训练效率。

Oct, 2016

使用肌肉机器人从零开始学习乒乓球

本文介绍一种利用气动人工肌肉和强化学习来安全地训练机器人学习打乒乓球的方法，同时演示了这种方法可以让机器人在高速运动下实现回球和攻击

Jun, 2020

基于无模型强化学习的乒乓球机器人

通过控制机器人关节以 100Hz 的速度返回乒乓球，我们提出了一种模型无关的算法，并证明了进化搜索方法能够在非视觉输入和时间之间卷积的基础上作用于基于 CNN 的策略体系结构，学习紧凑的控制器，在适当调整任务和奖励的情况下，策略能够发展多模态样式，同时在广泛的球类投掷范围内实现 80％的回球率，观察到多模性不需要任何建筑先验知识。

Mar, 2020

适应性棋局环境中的强化学习用于检测人类可理解概念

本研究展示了一种探测自学习算法在训练过程中内部概念的方法，以国际象棋游戏代理为例进行了演示，此方法适用于没有大量计算资源或机器学习模型的研究团体。

Nov, 2022