基于潜势的专家建议预测的新界限
本文基于最优控制理论的验证论证,扩展了最近开发的在线预测机器学习问题的潜力框架至随机(几何)停止版本,并通过不同类型的策略,构建了一系列随机版本的潜力函数,从而更加准确地预测问题的结果。
Dec, 2019
本研究中,我们考虑了一系列的重复预测游戏模型,并通过极限推导出非线性抛物型偏微分方程的超级解,这些超级解与 N.Cesa-Bianci,G.Lugosi(2003)所定义的潜力函数密切相关。所有这类超级解提供了预测者遗憾的上限界,同时表明了一个基于潜力的预测策略,能够满足 Blackwell 条件。通过验证论证,可以得出对于最坏情况下遗憾的常规上界。
May, 2017
本文研究通过在线机器学习的技术,建立了一个 “股票预测问题” 的模型,探讨了投资者和市场策略,并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。
Jul, 2020
通过数值分析和实验,本研究调查了在线机器学习中,基于敌对环境中的预测问题和专家建议。通过相关的偏微分方程,我们研究了一个涉及两个人在每一步进行决策的重复博弈问题,并开发了数值方法来近似解决该方程,通过利用方程和解的对称性来大大减小计算域的尺寸。基于我们的数值结果,我们提出了一些关于各种敌对策略的最优性的猜想,特别是关于 COMB 策略的非最优性。
Jun, 2024
本文针对 N=4 的专家预测问题,显式解出了非线性 PDE 和动态规划的连续极限,并证明了其策略达成了渐进纳什均衡,并证明了该问题确实来源于鞍点组合策略是最优的这一猜想的结果。
Nov, 2019
本文研究了一种在线学习算法,该算法将多个专家的预测结果融合为一个预测结果以提高准确性,并利用特定结构的效用函数设计了激励兼容性和无悔策略两个要求的算法,以应对专家可能误导算法的情况。
May, 2023
本文通过差分方程和随机微积分的连续时间分析视角,研究离散时间问题,提出了一个连续时间、无需参数算法,并开发了一个类似的离散算法,最后提出了一个任意时间的算法以应对最难情况,并给出了一些令人满意的实验证据。
Jun, 2022