有限时间 4 专家预测问题
通过数值分析和实验,本研究调查了在线机器学习中,基于敌对环境中的预测问题和专家建议。通过相关的偏微分方程,我们研究了一个涉及两个人在每一步进行决策的重复博弈问题,并开发了数值方法来近似解决该方程,通过利用方程和解的对称性来大大减小计算域的尺寸。基于我们的数值结果,我们提出了一些关于各种敌对策略的最优性的猜想,特别是关于 COMB 策略的非最优性。
Jun, 2024
本文使用最优控制理论的验证方法,将在线预测问题构造为一个有限时间的零和博弈问题,通过解析特定偏微分方程得到上下界,从而为多个专家数量和不同预测时段提供更优的预测模型。
Nov, 2019
本研究中,我们考虑了一系列的重复预测游戏模型,并通过极限推导出非线性抛物型偏微分方程的超级解,这些超级解与 N.Cesa-Bianci,G.Lugosi(2003)所定义的潜力函数密切相关。所有这类超级解提供了预测者遗憾的上限界,同时表明了一个基于潜力的预测策略,能够满足 Blackwell 条件。通过验证论证,可以得出对于最坏情况下遗憾的常规上界。
May, 2017
研究通过专家意见在对抗环境中进行预测问题时, 单独使用几何停止规则会导致过于保守的策略, 因此使用 comb 策略(在 4 个专家情况下为最优)来提高择优性能。
Feb, 2019
本文通过差分方程和随机微积分的连续时间分析视角,研究离散时间问题,提出了一个连续时间、无需参数算法,并开发了一个类似的离散算法,最后提出了一个任意时间的算法以应对最难情况,并给出了一些令人满意的实验证据。
Jun, 2022
本文研究通过在线机器学习的技术,建立了一个 “股票预测问题” 的模型,探讨了投资者和市场策略,并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。
Jul, 2020
本文研究了在对手设置下采用几何停止时间进行专家建议的预测经典问题。对于 2 个专家的情况,Cover 提出了最优算法。对于三个专家的情况,我们设计了最优算法和对手,并证明了该算法与一个特定的随机对手的概率匹配算法(类似于汤普森抽样)是最优的,该证明显示概率匹配算法不仅针对这个特定的随机对手是最优的,而且是极小化的。同时我们通过主对偶(primal-dual) 方法同时发展了上限和下限,并为任意数量的专家设计了最优算法和对手的通用框架。
Sep, 2014
本文基于最优控制理论的验证论证,扩展了最近开发的在线预测机器学习问题的潜力框架至随机(几何)停止版本,并通过不同类型的策略,构建了一系列随机版本的潜力函数,从而更加准确地预测问题的结果。
Dec, 2019