基于潜势的专家建议预测的新界限

Nov, 2019

基于潜势的专家建议预测的新界限

New Potential-Based Bounds for Prediction with Expert Advice

Vladimir A. Kobzar, Robert V. Kohn, Zhilei Wang

TL;DR本文使用最优控制理论的验证方法，将在线预测问题构造为一个有限时间的零和博弈问题，通过解析特定偏微分方程得到上下界，从而为多个专家数量和不同预测时段提供更优的预测模型。

Abstract

This work addresses the classic machine learning problem of online prediction with expert advice. We consider the finite-horizon version of this zero-sum, two-person game. Using verification arguments from

online prediction expert advice zero-sum game partial differential equations optimal control theory

发现论文，激发创造

基于潜在能量的几何停止版本预测与专家建议的新界限

本文基于最优控制理论的验证论证，扩展了最近开发的在线预测机器学习问题的潜力框架至随机（几何）停止版本，并通过不同类型的策略，构建了一系列随机版本的潜力函数，从而更加准确地预测问题的结果。

Dec, 2019

在线预测问题的 PDE 方法：基于潜势的策略构建

本研究中，我们考虑了一系列的重复预测游戏模型，并通过极限推导出非线性抛物型偏微分方程的超级解，这些超级解与 N.Cesa-Bianci，G.Lugosi（2003）所定义的潜力函数密切相关。所有这类超级解提供了预测者遗憾的上限界，同时表明了一个基于潜力的预测策略，能够满足 Blackwell 条件。通过验证论证，可以得出对于最坏情况下遗憾的常规上界。

May, 2017

专家建议预测：PDE 视角

研究了具有专家建议的在线预测问题，采用优化控制方法和非线性偏微分方程的黏度解来表征这个双人博弈的价值，并揭示了最优策略。

Apr, 2019

利用 PDE 方法从两个依赖于历史的专家建议预测二进制序列

本文研究通过在线机器学习的技术，建立了一个 “股票预测问题” 的模型，探讨了投资者和市场策略，并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。

Jul, 2020

由专家建议的预测引发的偏微分方程的数值解

通过数值分析和实验，本研究调查了在线机器学习中，基于敌对环境中的预测问题和专家建议。通过相关的偏微分方程，我们研究了一个涉及两个人在每一步进行决策的重复博弈问题，并开发了数值方法来近似解决该方程，通过利用方程和解的对称性来大大减小计算域的尺寸。基于我们的数值结果，我们提出了一些关于各种敌对策略的最优性的猜想，特别是关于 COMB 策略的非最优性。

Jun, 2024

有限时间 4 专家预测问题

本文针对 N=4 的专家预测问题，显式解出了非线性 PDE 和动态规划的连续极限，并证明了其策略达成了渐进纳什均衡，并证明了该问题确实来源于鞍点组合策略是最优的这一猜想的结果。

Nov, 2019

未知数量专家建议的预测

考虑利用专家建议进行预测并引入一种基于防御性预测方法的、针对多值超级鞅的应用，提出一种不包含名义专家数量的损失界限。

Jun, 2010

使用专家建议的预测的改进二阶界限

该研究探讨了带有正负回报的顺序预测游戏中外部遗憾的问题，应用了加权平均预测和不同乘法更新规则的新预测方法，并得到了更精确的遗憾界限。

Feb, 2006

具有战略专家的无悔在线预测

本文研究了一种在线学习算法，该算法将多个专家的预测结果融合为一个预测结果以提高准确性，并利用特定结构的效用函数设计了激励兼容性和无悔策略两个要求的算法，以应对专家可能误导算法的情况。

May, 2023

专家建议下的连续预测

本文通过差分方程和随机微积分的连续时间分析视角，研究离散时间问题，提出了一个连续时间、无需参数算法，并开发了一个类似的离散算法，最后提出了一个任意时间的算法以应对最难情况，并给出了一些令人满意的实验证据。

Jun, 2022