Jul, 2022

多智能体强化学习在基于竞拍的长期网络资源分配中的应用:V2X 应用

TL;DR本文旨在研究如何实现计算任务从移动代理转移,其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此,该文设计了一个新的多代理在线学习算法,并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。