Mar, 2014

二人零和博弈的多智能体逆强化学习

TL;DR本文提出了一种贝叶斯框架,用于解决多智能体逆强化学习问题,在多智能体对战场景下建立了一种理论基础,并针对双智能体零和MIRL问题提出了一种贝叶斯解决方法,结果表明,奖励先验中协方差结构比均值更重要。