Jun, 2022

高社会福利纳什均衡的规范导向学习

TL;DR本文提出了一种用于训练多智能体系统中的纳什均衡的强化学习框架,该框架利用高级规定来编码目标,并优先考虑多智能体系统的社会福利,经验评估表明,相对于现有方法,本算法计算的纳什均衡策略具有更高的社会福利。