Oct, 2021

通过根对数正则化实现Minimax最优分位数和半对抗性遗憾

TL;DR利用FTRL算法具有不同的正则化器降低Quantile和KL regret bounds,与 NormalHedge 和其变体相比,成功完成对抗数据中对大多数专家而不是最佳专家进行竞争,并在半对抗范式中使用自适应最小值的算法来适应真实、未知的约束条件,导致了统一改进的regret上限。