BriefGPT.xyz
Ask
alpha
关键词
ctde
搜索结果 - 2
SEA:一种用于多智能体强化学习的空间显式架构
本文提出了一种空间信息提取结构,能够针对多智能体强化学习问题中智能体数量变化和规模巨大等问题,通过编码器 - 解码器结构有效地共享邻域和全局信息。该方法遵循中央训练和分散执行(CTDE)模式,并可以应用于各种现有的主流强化学习算法,在细微修
→
PDF
a year ago
基于蒸馏执行的个性化多智体强化学习训练
本文提出了一种新的多智能体强化学习范式 (PTDE) ,通过对全局信息进行个性化设置,将个体的全局信息提炼成本地信息,用于分权执行,实现更好的性能,其可与现有的算法结合使用,提高性能。
PDF
2 years ago
Prev
Next