Oct, 2020

无遗憾学习和混合纳什均衡:不能相互混合

TL;DR本文研究了 no-regret 动力学中最常被考虑的动态系统之一 - Follow-the-regularized-leader 的行为,证明了非严格的纳什均衡对于 no-regret 学习是不稳定的且不能吸引该动态系统的稳定状态,因此只有严格的纳什均衡是 no-regret 动力学的稳定限制点。