高效追踪大类专家
本文研究了一种在线学习算法,该算法将多个专家的预测结果融合为一个预测结果以提高准确性,并利用特定结构的效用函数设计了激励兼容性和无悔策略两个要求的算法,以应对专家可能误导算法的情况。
May, 2023
本文研究通过在线机器学习的技术,建立了一个 “股票预测问题” 的模型,探讨了投资者和市场策略,并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。
Jul, 2020
本文提出了一种基于扰动随从最优策略算法版本,可以将累积损失通过独立的对称随机游动进行扰动,预测者能够实现期望遗憾最优阶 O (sqrt (n log N)), 且预测者的改变在预期下最多为 O (sqrt (n log N)),同时拓展分析在线组合优化,表明即使在更一般的情况下,预测者也很少在专家之间切换,同时达到近乎最优的遗憾级别。
Feb, 2013
本文通过差分方程和随机微积分的连续时间分析视角,研究离散时间问题,提出了一个连续时间、无需参数算法,并开发了一个类似的离散算法,最后提出了一个任意时间的算法以应对最难情况,并给出了一些令人满意的实验证据。
Jun, 2022
我们研究了在线预测问题,通过简单修改睡眠专家技术,给出了多项群组的遗憾保证,与先前的工作相比具有类似的遗憾保证,并且在群组数目为多项式有界且外部遗憾问题可有效求解时具备高效性。着重考虑了在线线性回归和在线组合优化问题,并在合成数据和两个真实数据集上进行了广泛实验评估,结果显示相比于标准在线线性回归算法,我们的算法在群组间给出了显著的错误改善。
Oct, 2023
本文研究了预测中的不同类型自适应(非固定的)对手的强度,使用新概念的策略遗憾去衡量玩家的表现,特别关注记忆和切换成本的自适应对手,具有均摊 2/3 次幂的速率且强度显著较弱。
Feb, 2013
研究了如何适应信息获取成本昂贵的在线学习问题中平稳变化环境的影响;提出了一种算法用于处理标签有效预测的问题,并扩展到标签有效的赌博反馈和揭示行动部分监测游戏等领域,显著提高了现有算法的性能。
Oct, 2019
研究了在线预测问题,使用 Banach 空间方法构建了预测算法,其平均损失不超过基准类中任何预测规则的平均损失加上一个 O (N^(-1/p)) 的 “遗憾项”,其中 p 在 [2,无穷大) 范围内,并反映出基准类未能成为希尔伯特空间的程度。
Dec, 2005