Jun, 2023

EMOTE: 一种基于共情的可解释性建模他人的架构

TL;DR通过设计 Imagination Network 对另一个玩家的行动价值函数进行建模,从而使学习代理产生类似于其他代理的行为,这种方法尤其适用于使用复合价值或奖励函数的算法,在多智能体游戏中产生更好的性能表现。