May, 2022

多智能体系统风险管理的博弈论框架

TL;DR本文介绍了一种基于风险规避博弈 (RAE) 的解决方案,该方案旨在尽量减少其他代理策略引起的奖励潜在方差,在多智能体强化学习框架下通过实验证明了其最小化奖励变差的效果以及在自动驾驶中减少事故率的表现。