BriefGPT.xyz
Ask
alpha
关键词
decentralized marl
搜索结果 - 4
基于表征通信的大规模交通信号控制的多智能体强化学习
基于通信的多智能体强化学习(MARL)框架用于大规模交通信号控制,每个智能体学习通信策略以选择消息的发送对象和交换可变长度的消息,实现去中心化和灵活的通信机制,并在网络拥塞和性能方面表现优于相关方法。
PDF
9 months ago
零和马尔可夫博弈的分散式 Q 学习
本研究在非协调控制下,针对无限期、折现、零和马尔可夫博弈中的多智能体强化学习进行了研究。提出了一种无限期 Q 学习动态,该学习动态在没有集中控制器的情况下收敛到 Nash 均衡点,并且可以有效应对非固定环境的挑战。
PDF
3 years ago
IJCAI
基于模型的多智能体策略优化与对手智能化决策
本文研究了多智能体强化学习中的基于模型的方法,提出了自适应对手推演策略优化(AORPO)的分散化的基于模型的 MARL 方法,旨在全过程中降低样本复杂度,并在竞争和合作任务中开展实证研究,表明 AORPO 能够实现比对比 MARL 方法更好
→
PDF
3 years ago
网络代理的去中心化多智能体强化学习:最新进展
本文回顾了多智能体强化学习的一个分支领域 —— 网络化智能体下的去中心化多智能体强化学习。该领域的研究主要集中在多个代理在公共环境中执行顺序决策,而无需任何中央控制器的协调。代理可以通过通信网络与其邻居交换信息。此设置在机器人,无人驾驶车辆
→
PDF
5 years ago
Prev
Next