Feb, 2020

基于推断的一般求和差分博弈策略对齐

TL;DR文章提出了一个通用框架,通过推断其他代理方的平衡状态来解决不确定性问题,并在多人机器人导航问题的模拟中证明,通过对准平衡状态,机器人可以更准确地预测轨迹并降低所有玩家的成本。