ICMLMar, 2011

计算理性化:逆平衡问题

TL;DR该文介绍了一种在多智能体领域应用的、基于逆优化控制、遗憾和最大熵原理的方法,用于预测与推广多智能体的行为,并恢复其奖励函数。