Sep, 2017

对抗学习感知的学习

TL;DRLOLA 是一种用于多智能体学习的方法,在 agent 间显式地考虑其他 agent 的学习,以达到识别和利用合作的目的。