Oct, 2020

未知马尔可夫博弈中的在线学习

TL;DR本文研究未知马尔可夫博弈的在线学习问题以及提出了一种算法,实现了与后记中的最佳响应之间亚线性的最小化值的竞争。