Apr, 2015

观察并学习:从明示偏好反馈中进行优化

TL;DR本文提出通过揭示意向方法,解决了在 follower 效用函数未知的 Stackelberg 博弈中求解 leader 最优策略的问题,并在包括利润最大化和非原子性拥塞博弈最优通行费率问题在内的广泛问题上表现良好。