高效追踪大类专家

Oct, 2011

Efficient Tracking of Large Classes of Experts

András Gyorgy, Tamás Linder, Gábor Lugosi

TL;DR本文提出了一种利用基本算法 A 设计跟踪算法的方法，对于二进制序列预测在对数损失下，时间复杂度仅为 O（n^（1+γ）ln n），达到了最优的 O（ln n）的遗憾率。

Abstract

In the framework of prediction of individual sequences, sequential prediction methods are to be constructed that perform nearly as well as the best expert from a given class. We consider prediction strategies that compete with the class of →

sequential prediction switching strategies tracking algorithm regret bound computational efficiency

发现论文，激发创造

无损预测策略

该文介绍了一种算法，可以在任何时间段内对任何字符串进行零误差预测，同时在总体上得到小的遗憾值，并将这种算法扩展到 $N$ 个专家的一般情况。

Aug, 2010

在线序列预测中的专家学习

本文介绍一种在线学习算法，利用先前观察到的数据训练一组有效的专家，以在短序列上进行点击预测。

Jun, 2012

具有战略专家的无悔在线预测

本文研究了一种在线学习算法，该算法将多个专家的预测结果融合为一个预测结果以提高准确性，并利用特定结构的效用函数设计了激励兼容性和无悔策略两个要求的算法，以应对专家可能误导算法的情况。

May, 2023

利用 PDE 方法从两个依赖于历史的专家建议预测二进制序列

本文研究通过在线机器学习的技术，建立了一个 “股票预测问题” 的模型，探讨了投资者和市场策略，并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。

Jul, 2020

随机行走扰动预测

本文提出了一种基于扰动随从最优策略算法版本，可以将累积损失通过独立的对称随机游动进行扰动，预测者能够实现期望遗憾最优阶 O (sqrt (n log N)), 且预测者的改变在预期下最多为 O (sqrt (n log N))，同时拓展分析在线组合优化，表明即使在更一般的情况下，预测者也很少在专家之间切换，同时达到近乎最优的遗憾级别。

Feb, 2013

专家建议下的连续预测

本文通过差分方程和随机微积分的连续时间分析视角，研究离散时间问题，提出了一个连续时间、无需参数算法，并开发了一个类似的离散算法，最后提出了一个任意时间的算法以应对最难情况，并给出了一些令人满意的实验证据。

Jun, 2022

Oracle 群体损失的高效算法

我们研究了在线预测问题，通过简单修改睡眠专家技术，给出了多项群组的遗憾保证，与先前的工作相比具有类似的遗憾保证，并且在群组数目为多项式有界且外部遗憾问题可有效求解时具备高效性。着重考虑了在线线性回归和在线组合优化问题，并在合成数据和两个真实数据集上进行了广泛实验评估，结果显示相比于标准在线线性回归算法，我们的算法在群组间给出了显著的错误改善。

Oct, 2023

具有切换成本和其他自适应对手的在线学习

本文研究了预测中的不同类型自适应（非固定的）对手的强度，使用新概念的策略遗憾去衡量玩家的表现，特别关注记忆和切换成本的自适应对手，具有均摊 2/3 次幂的速率且强度显著较弱。

Feb, 2013

信息约束在线学习中的适应性

研究了如何适应信息获取成本昂贵的在线学习问题中平稳变化环境的影响；提出了一种算法用于处理标签有效预测的问题，并扩展到标签有效的赌博反馈和揭示行动部分监测游戏等领域，显著提高了现有算法的性能。

Oct, 2019

与野生预测规则竞争

研究了在线预测问题，使用 Banach 空间方法构建了预测算法，其平均损失不超过基准类中任何预测规则的平均损失加上一个 O (N^(-1/p)) 的 “遗憾项”，其中 p 在 [2，无穷大) 范围内，并反映出基准类未能成为希尔伯特空间的程度。

Dec, 2005