May, 2024
在线学习中 FTRL 的简单自适应学习率与 Θ(T^{2/3}) 的最小 max 遗憾及其在最佳两全之间的应用
A Simple and Adaptive Learning Rate for FTRL in Online Learning with Minimax Regret of $Θ(T^{2/3})$ and its Application to Best-of-Both-Worlds
Taira Tsuchiya, Shinji Ito
TL;DR通过设计自适应的正则化器和学习率,FTRL 是一个强大的框架,适用于各种在线学习问题。本文提出了一个新的自适应学习率框架来解决具有 Θ(T^{2/3}) 最小最大遗憾的问题,并应用于部分监控和图形赌博两个重要的间接反馈问题。