We study how to adapt to smoothly-varying ('easy') environments in well-known
online learning problems where acquiring information is expensive. For the
problem of label efficient prediction, which is a budgeted
我们提出了一种适用于未知特征生成过程的混合在线学习的、高效的预测方法,证明了该方法可在有限的 VC 类中实现具有次线性的遗憾上限,并在具有 α fat-shattering 维度的类中实现具有次线性的遗憾上限。此外,我们拓展了我们的结果到具有 K 个变化的分布转移场景,并为具有有限策略集合 H 和未知分布的 i.i.d. 生成的上下文以及敌对生成的成本的情境 K 臂赌博机建立了遗憾上限。