BriefGPT.xyz
Ask
alpha
关键词
value decomposition network architecture
搜索结果 - 1
协作多智体学习的价值分解网络
利用价值分解网络架构解决合作多智能体强化学习中的观测部分性、虚假奖励和 “懒惰智能体” 问题,并在与共享权重、角色信息和信息通道相结合的情况下,在部分可观测的多智能体领域取得优越结果。
PDF
7 years ago
Prev
Next