BriefGPT.xyz
大模型
Ask
alpha
关键词
universal policy decoupling transformer
搜索结果 - 1
UPDeT:基于 Transformer 的策略解耦通用多智能体强化学习
本文提出了一种称为 Universal Policy Decoupling Transformer (UPDeT) 的 transformer-based 模型,可插入任何多智能体强化学习管道并具备强大的泛化能力,证明了相对于现有方法具有优
→
PDF
3 years ago
Prev
Next