群体系统的引导深度强化学习

Sep, 2017

Guided Deep Reinforcement Learning for Swarm Systems

Maximilian Hüttenrauch, Adrian Šošić, Gerhard Neumann

TL;DR本文研究了如何使用有限的传感能力控制一组合作智能体，使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估，评估了在寻找和维持距离和定位目标方面的性能。

Abstract

In this paper, we investigate how to learn to control a group of cooperative agents with limited sensing capabilities such as robot swarms. The agents have only very basic sensor capabilities, yet in a group they can accomplish sophisticated tasks, such as distributed assembly or searc

group control cooperative agents limited sensing actor-critic approach deep reinforcement learning

发现论文，激发创造

全局状态预测的分布式多智能体强化学习

本文探讨了应用深度强化学习（Deep reinforcement learning, DRL）到机器人群体控制中的挑战，并提出了一种基于部分可观察马尔科夫决策过程（Partially Observable Markov Decision Process, POMDP）的解决方案，通过比较几个深度强化学习算法的表现，证明了全局状态预测（Global State Prediction, GSP）可以提高性能和鲁棒性。

Jun, 2023

分散化强化学习多机器人编队控制

基于强化学习算法的分布式多机器人编队控制，并采用 DDQN 算法，通过离散机器人运动来适应连续非线性系统，无需复杂数学模型和非线性控制器即可在模拟和实验中实现稳定编队。

Jun, 2023

群体系统的深度强化学习

提出了一种基于分布的平均嵌入（mean embeddings）状态表示法，适用于具有大量同质代理的群集系统；在深度多智能体强化学习中利用神经网络方式实现的平均嵌入表示法可实现最丰富的邻近智能体信息交换，促进更复杂的集体策略的发展。

Jul, 2018

学习通信感知协调的机器人群体模拟

本研究主要探讨了如何应用基于观察专家演示的控制器学习算法，训练出端到端的神经网络，用于解决协作多智能体系统中的分布式控制问题，实验结果表明，使用通信策略可以有效提高分布式模型的性能。

Feb, 2023

利用空中机器人群体协作深度强化学习方法学习在湍流中导航

本文研究了多飞行器在恶劣气流环境中的运动控制问题，并提出了一种基于深度强化学习和图形卷积神经网络的解决方法，能够帮助机器人团队实现更好的气流补偿和协同运动。

Jun, 2023

集体机器人分布式异步引导策略搜索强化学习

本文探讨了分布式异步策略学习作为实现机器人具备普适性和提高复杂任务训练效率的手段。实验证明，使用这种方法可以提高机器人对任务的泛化、利用和训练时间效率，从而在视觉门开启任务中取得更好的效果。

Oct, 2016

DeepHive：一种基于多智能体强化学习的自动发现群体优化策略的方法

本文提出了一种基于群体智能的全局优化器设计方法，将其问题形式化为强化学习问题，测试结果表明该方法在各种基准优化函数上的表现优于其他全局优化策略，并且具有良好的普适性，可用于快速开发特定领域的优化器。

Mar, 2023

利用强化学习导航微型机器人群体以进行定向输送

本研究使用强化学习算法 (PPO 和 RPO) 来控制微型机器人群在水力影响下到达目标。研究表明课程学习可以提高性能，并展示了在控制 25 个游泳器协同机动方面 RL 模型的能力。

Jun, 2023

可扩展的基于任务驱动的机器人群控制：碰撞回避和学习的均场控制

本文提出了一种基于均场控制的智能机器人群体行为设计框架，结合碰撞避免和均场控制学习，通过单智能体分布控制实现多智能体分布控制，实现分布式开环应用并避免碰撞，并在理论和实践上对其进行了有效性验证。

Sep, 2022

基于 MPC 引导的策略搜索学习自主飞行器深度控制策略

模型预测控制与强化学习相结合并在引导策略搜索框架下应用，通过使用机载传感器数据在训练时间内训练神经网络策略，该策略可成功地控制四旋翼飞行器的避障而无需系统完整状态知识。

Sep, 2015