本文回顾了多智能体强化学习的一个分支领域 —— 网络化智能体下的去中心化多智能体强化学习。该领域的研究主要集中在多个代理在公共环境中执行顺序决策,而无需任何中央控制器的协调。代理可以通过通信网络与其邻居交换信息。此设置在机器人,无人驾驶车辆,移动传感器网络和智能电网的控制和操作中具有广泛应用。
Dec, 2019
该论文介绍了多智能体强化学习在自主移动中的应用,包括行为规划、车辆之间通信、性能提升等方面,并探讨了该领域的一些最新方法和想法。
Mar, 2022
本文总结了分布式无模型多智能体强化学习在多机器人协作中面临的挑战以及现有的解决方案类别,并介绍了基准测试和机器人应用,同时讨论了当前的研究方向。
Apr, 2022
本文旨在回顾多智能体强化学习的基本方法、应用场景和当前存在的问题,提出未来十年的研究方向。研究重点包括多智能体强化学习的可扩展性、非平稳性、可信性、安全性、鲁棒性、泛化性和伦理约束等方面。另外,人机交互等人文因素是实际应用中必须考虑的问题。
May, 2023
本综述文章探讨了最新的多智能体强化学习算法,特别关注建模和解决合作多智能体强化学习问题的五种常见方法,以及 MARL 在真实世界应用中的成功,并提供了可用于 MARL 研究的环境列表和可能的研究方向。
Aug, 2019
本文回顾了现有的关于基于模型的多智能体强化学习的研究,包括理论分析、算法和应用,并分析了基于模型的多智能体强化学习的优势和潜力。此外,我们提供了算法的详细分类,并根据多智能体情景中固有的挑战指出每个算法的优点和缺点。最后,我们总结了这一领域未来发展的有前途的方向。
本研究提供了一个笔记,从博弈论的角度全面介绍了现代多代理强化学习技术的基础和最新发展,旨在为即将进入这个快速增长的领域的新研究人员和现有领域专家提供有关目前最先进的 MARL 技术的自包含评估,并根据最新进展确定新方向。
Nov, 2020
本文在 selective 的视角下提供了多智能体强化学习领域的理论分析综述,重点关注 Markov/stochastic games 和 extensive-form games 框架下的 MARL 算法的理论结果,并突出了 MARL 理论的几个新角度和分类,探讨了在学习博弈论、分散式多智能体、平均场与(非)收敛、多类型任务等方面的有前途的未来研究方向。
Nov, 2019
这篇综述论文研究了在大规模群体系统中进行可控分析和多智能体强化学习的关键问题和挑战,介绍了现有的相关研究领域和方法,并讨论了未来的应用前景和方向。
Sep, 2022
本文提出了一种基于深度强化学习的近似最佳响应策略混合和实证博弈理论分析的算法,用以解决多智能体强化学习中独立强化学习过度拟合其他智能体政策的问题,并且在网格世界协调游戏和扑克牌等部分可观察环境中取得了不错的结果.
Nov, 2017