机器人空中曲棍球动态交互的强化学习实验平台,包括从简单的任务到复杂的任务,支持模拟到真实世界的迁移,并使用演示数据评估了行为克隆、离线强化学习和从零开始的强化学习。
May, 2024
本论文提出了一种基于深度强化学习(DRL)的新方法来捕捉游戏背景,该方法使用 3M NBA 比赛的 play-by-play 事件来学习一个行动价值 Q 函数,并引入一种新的游戏影响度量(GIM)来评估玩家的整体表现。评估结果表明,GIM 在整个赛季中保持一致,并与标准成功指标和未来薪资高度相关。
May, 2018
本文研究了深度强化学习在机器人学中的应用,通过模拟训练,在低成本仿真机器人上实现了动态环境下复杂足球比赛中从走路到踢球等一系列动作表现出稳定流畅的运动技能,并取得了不错的效果。
Apr, 2023
通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。
Mar, 2020
我们运用多智能体深度强化学习(RL)通过自我中心的 RGB 视觉训练端到端的机器人足球策略,解决了现实世界机器人领域中的许多挑战,包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端多智能体机器人足球的训练,并能够在真实世界中部署。
这篇论文通过深度强化学习中的自我对战迭代程序展示了如何创建越来越多样化的交通场景并学习多智能体协作策略提高合并操作成功率。
Jan, 2020
本文介绍一种基于深度 Q 函数算法的深度强化学习方法,能够实现在真实的物理机器人上进行复杂的 3D 操作任务学习,并通过多个机器人异步汇聚优化策略更新等技术进一步提高训练效率。
Oct, 2016
本文介绍一种利用气动人工肌肉和强化学习来安全地训练机器人学习打乒乓球的方法,同时演示了这种方法可以让机器人在高速运动下实现回球和攻击
Jun, 2020
通过控制机器人关节以 100Hz 的速度返回乒乓球,我们提出了一种模型无关的算法,并证明了进化搜索方法能够在非视觉输入和时间之间卷积的基础上作用于基于 CNN 的策略体系结构,学习紧凑的控制器,在适当调整任务和奖励的情况下,策略能够发展多模态样式,同时在广泛的球类投掷范围内实现 80%的回球率,观察到多模性不需要任何建筑先验知识。
本研究展示了一种探测自学习算法在训练过程中内部概念的方法,以国际象棋游戏代理为例进行了演示,此方法适用于没有大量计算资源或机器学习模型的研究团体。
Nov, 2022