分散化强化学习多机器人编队控制

MMJun, 2023

分散化强化学习多机器人编队控制

Decentralized Multi-Robot Formation Control Using Reinforcement Learning

Juraj Obradovic, Marko Krizmancic, Stjepan Bogdan

TL;DR基于强化学习算法的分布式多机器人编队控制，并采用 DDQN 算法，通过离散机器人运动来适应连续非线性系统，无需复杂数学模型和非线性控制器即可在模拟和实验中实现稳定编队。

Abstract

This paper presents a decentralized leader-follower multi-robot formation control based on a reinforcement learning (RL) algorithm applied to a swarm of small educational Sphero robots. Since the basic Q-learning method is known to require large memory resources for Q-tables, this work

multi-robot formation control reinforcement learning ddqn algorithm robot motion adaptation simulation and real experiments

发现论文，激发创造

群体系统的引导深度强化学习

本文研究了如何使用有限的传感能力控制一组合作智能体，使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估，评估了在寻找和维持距离和定位目标方面的性能。

Sep, 2017

基于深度 Q 学习的自主仓库机器人

提出采用深度强化学习和传统的 Q-learning 方法来解决仓库机器人导航，避障和产品摆放等问题，包括针对单机器人，多机器人的情况，成功在二维仿真环境中测试了模型的性能。

Feb, 2022

使用深度强化学习的机器人路径规划

本文介绍了如何使用强化学习方法和深度 Q 网络等算法，使得机器人可以在未知环境中进行自主导航的任务。我们还利用模拟环境对机器人代理的行为和性能进行了验证和分析。

Feb, 2023

基于生物启发神经动力学的移动机器人分布式稳健学习形成控制

本论文针对多移动机器人的分布式编队控制提出了一种提高现实可行性的新方法，首先采用变结构和级联设计技术引入分布式估计器，消除了对导数信息的需求以提高实时性能，然后采用仿生神经动力学方法开发了一种运动学跟踪控制方法，旨在提供平滑的控制输入并有效解决速度跳跃问题，此外还提出了一种基于学习的鲁棒动态控制器，以解决在完全未知动力学和干扰下操作的机器人的挑战，该控制器在实时参数估计的同时保持了其对干扰的鲁棒性，并通过严密的数学分析证明了所提方法的整体稳定性，最后，多个综合仿真研究表明了所提方法的优势和有效性。

Mar, 2024

异步离线更新下的机器人操作深度强化学习

本文介绍一种基于深度 Q 函数算法的深度强化学习方法，能够实现在真实的物理机器人上进行复杂的 3D 操作任务学习，并通过多个机器人异步汇聚优化策略更新等技术进一步提高训练效率。

Oct, 2016

基于强化学习的自主机器人导航研究

基于强化学习的自主导航方法，采用深度 Q 网络（DQN）和近端策略优化（PPO）模型，通过机器人与环境的连续交互和实时反馈奖励信号，对路径规划和决策过程进行优化，提高机器人在未知环境中的导航能力和自适应性。

Jul, 2024

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

复杂机器人系统的分散式动作技能学习

提出去中心化马达技巧（DEMOS）学习算法，改进了基于单个神经网络的强化学习控制器对任务的高度依赖性，并且在保持性能的同时提高了策略的鲁棒性和泛化能力。该算法通过自动发现可分离的马达群组并学习分散控制策略，可以在四足和人形机器人上实现。

Jun, 2023

学习分散式多臂运动规划器

我们提出了一种具有可扩展性和灵活性的闭环多臂机器人运动规划器，利用多智能体强化学习，训练去中心化策略以控制一个机械臂达到目标终端执行器姿态，通过利用经典规划算法来提高强化学习算法的学习效率，保留神经网络的快速推理时间，得出一个作用于不同团队规模的柔性政策。

Nov, 2020

使用强化学习创建动态四足机器人守门员

我们提出了一个基于强化学习的框架，使得四足机器人在真实世界中执行足球门将任务。

Oct, 2022