Sep, 2020

镜像下降和信息比率

TL;DR本论文研究了镜像下降法和信息比率之间的关系,探讨了在采样信息导向时,采用合适的损失估计器和探索分布的镜像下降法和信息导向采样的贝叶斯后验遗憾上限呈现相同的下降趋势,并且本文还提供了一种有效的算法用于敌对赌博问题中,该算法的遗憾上限与信息理论上限完全匹配。