Aug, 2022

把它写下来:正式合同缓解多智能体强化学习中的社会困境

TL;DR本文提出一种基于经济学中形式合同思想的多智能体强化学习方法,实现在自私代理中解决个人与群体奖励分歧问题,并通过经验实验得出,该增强方法可使马尔可夫游戏中所有平稳状态达到社会最优行为策略。