BriefGPT.xyz
Ask
alpha
关键词
multi-agent rl
搜索结果 - 24
深度多智能体强化学习的简化行动解码器
该研究提出了一种基于深度多智能体强化学习方法,即 Simplified Action Decoder(SAD),它通过利用集中式训练阶段解决了训练过程中策略非常难以观察的问题,从而在 Hanabi 挑战赛的部分元素中,建立了一个新的 SOT
→
PDF
5 years ago
多智能体强化学习:理论和算法的选择性概述
本文在 selective 的视角下提供了多智能体强化学习领域的理论分析综述,重点关注 Markov/stochastic games 和 extensive-form games 框架下的 MARL 算法的理论结果,并突出了 MARL 理
→
PDF
5 years ago
多智能体深度强化学习用于大规模交通信号控制
本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法,以提高城市交通网络中的自适应交通信号控制的可观测性和减少学习难度,并在大型合成交通网格和摩纳哥城的大型实际交通网络下,通过模拟高峰流量动态,并将其与独立 A2C 和独立 Q-l
→
PDF
5 years ago
可微分游戏中的稳定对手塑造
该论文提出了稳定对手塑造方法,该方法通过插值实现了区分对手学习(LOLA)和稳定对手塑造的最佳属性,并在可微分游戏中表现出卓越的性能。
PDF
6 years ago
Prev
Next