Jun, 2020

个体性的出现

TL;DR本文提出了一种基于强化学习的多智体合作算法,特别着重于个体化。这种算法学习一个概率分类器来预测代理人身份,从而赋予每个代理人固有的动机,鼓励代理人访问自己熟悉的观测,促进个体性的出现,并在多种多智体协同情景中显著优于现有方法。