BriefGPT.xyz
Ask
alpha
关键词
noisy rewards
搜索结果 - 1
基于噪声分布分解的多智能体分布式强化学习
该论文提出了一种基于分解的多智能体分布式强化学习方法,通过将全局共享的嘈杂奖励近似为高斯混合模型并将其分解为各自分布式本地奖励的组合,从而使每个智能体能够通过分布式强化学习进行局部更新。
PDF
7 months ago
Prev
Next