May, 2024

在线学习中 FTRL 的简单自适应学习率与 Θ(T^{2/3}) 的最小 max 遗憾及其在最佳两全之间的应用

TL;DR通过设计自适应的正则化器和学习率,FTRL 是一个强大的框架,适用于各种在线学习问题。本文提出了一个新的自适应学习率框架来解决具有 Θ(T^{2/3}) 最小最大遗憾的问题,并应用于部分监控和图形赌博两个重要的间接反馈问题。