May, 2023

基于奖励机制的强化学习在随机博弈中的应用

TL;DR本文探讨了利用奖励机制来实现高级任务的多智能体强化学习算法QRM-SG,能在Nash平衡下在多智能体系统中学习最优策略,并且在三个案例研究中证明了其有效性。