Jan, 2024

未知分布的高效混合在线学习

TL;DR我们提出了一种适用于未知特征生成过程的混合在线学习的、高效的预测方法,证明了该方法可在有限的 VC 类中实现具有次线性的遗憾上限,并在具有 α fat-shattering 维度的类中实现具有次线性的遗憾上限。此外,我们拓展了我们的结果到具有 K 个变化的分布转移场景,并为具有有限策略集合 H 和未知分布的 i.i.d. 生成的上下文以及敌对生成的成本的情境 K 臂赌博机建立了遗憾上限。