具有时序反馈图的对抗在线学习

Jun, 2024

Adversarial Online Learning with Temporal Feedback Graphs

Khashayar Gatmiry, Jon Schneider

TL;DR基于分区策略，本研究提出了一种新的学习算法，用于预测与专家建议的问题并同时受限于反馈图结构，证明对于传递反馈图，该算法可以高效实现且达到最优遗憾界（与一个常数因子定量相近）的预测性能优化。

Abstract

We study a variant of prediction with expert advice where the learner's action at round $t$ is only allowed to depend on losses on a specific subset of the rounds (where the structure of which rounds' losses are visible at time $t$ is provided by a directed "→

prediction with expert advice feedback graph learning algorithm lower bound regret bound

发现论文，激发创造

反馈图的在线学习：超越赌博机

研究在线学习问题中的反馈问题，证明反馈图的结构控制引起的学习难度，并给出了三个类别的反馈图的理论极限表现和影响。

Feb, 2015

带部分信息的在线学习小损失界

研究了拥有部分信息反馈的对抗 (非随机) 在线学习问题，在黑盒模型下能够获得如上小损失的概率，而其独特的设计使它在更多应用如半强盗问题和上下文强盗问题中得到有效的应用，并且能够提供一些之前无法获得的最优保证。

Nov, 2017

同时学习具有一般图反馈的随机与对抗赌博机

本文研究了在线学习中使用图形反馈的问题，提出了一种新的权衡机制，能够同时在随机环境和对抗环境取得最优结果，具有很好的推广性。

Jun, 2022

反馈图网络在线学习：损失函数的真实形态