Nov, 2022

多智能体价值分解的对比身份感知学习

TL;DR通过对代理商的属性进行对比性学习,从而突破多代理多样性限制,增强价值分解网络的可区分性,提高合作能力