IJCAIMay, 2021

透过赠予行为促进多智体游戏中的道德行为

TL;DR本研究提出了一种使用对等激励机制指导智能体协调、从而实现更符合社会期望的 Nash 均衡的方法,实验发现,使用此方法可以增加博弈模型收敛到期望均衡的概率。