Jul, 2023

隐含的重要性权重感知更新

TL;DR利用广义隐式 Follow-the-Regularized-Leader (FTRL) 框架,通过对比梯度更新,本文首次展示了重要性权重感知(Importance Weight Aware,IWA)更新在在线学习中具有更好的遗憾上界,进一步说明 IWA 更新可被视为近似的隐式 / 近端更新。