有限时间 4 专家预测问题

Nov, 2019

Finite-Time 4-Expert Prediction Problem

Erhan Bayraktar, Ibrahim Ekren, Xin Zhang

TL;DR本文针对 N=4 的专家预测问题，显式解出了非线性 PDE 和动态规划的连续极限，并证明了其策略达成了渐进纳什均衡，并证明了该问题确实来源于鞍点组合策略是最优的这一猜想的结果。

Abstract

We explicitly solve the nonlinear pde that is the continuous limit of dynamic programming of \emph{expert prediction problem} in finite horizon setting with $N=4$ experts. The \emph{→

nonlinear pde dynamic programming expert prediction problem nash equilibrium regret

发现论文，激发创造

专家建议预测：PDE 视角

研究了具有专家建议的在线预测问题，采用优化控制方法和非线性偏微分方程的黏度解来表征这个双人博弈的价值，并揭示了最优策略。

Apr, 2019

由专家建议的预测引发的偏微分方程的数值解

通过数值分析和实验，本研究调查了在线机器学习中，基于敌对环境中的预测问题和专家建议。通过相关的偏微分方程，我们研究了一个涉及两个人在每一步进行决策的重复博弈问题，并开发了数值方法来近似解决该方程，通过利用方程和解的对称性来大大减小计算域的尺寸。基于我们的数值结果，我们提出了一些关于各种敌对策略的最优性的猜想，特别是关于 COMB 策略的非最优性。

Jun, 2024

基于潜势的专家建议预测的新界限

本文使用最优控制理论的验证方法，将在线预测问题构造为一个有限时间的零和博弈问题，通过解析特定偏微分方程得到上下界，从而为多个专家数量和不同预测时段提供更优的预测模型。

Nov, 2019

在线预测问题的 PDE 方法：基于潜势的策略构建

本研究中，我们考虑了一系列的重复预测游戏模型，并通过极限推导出非线性抛物型偏微分方程的超级解，这些超级解与 N.Cesa-Bianci，G.Lugosi（2003）所定义的潜力函数密切相关。所有这类超级解提供了预测者遗憾的上限界，同时表明了一个基于潜力的预测策略，能够满足 Blackwell 条件。通过验证论证，可以得出对于最坏情况下遗憾的常规上界。

May, 2017

关于利用专家建议进行预测的组合策略的渐近最优性

研究通过专家意见在对抗环境中进行预测问题时，单独使用几何停止规则会导致过于保守的策略，因此使用 comb 策略（在 4 个专家情况下为最优）来提高择优性能。

Feb, 2019

专家建议下的连续预测

本文通过差分方程和随机微积分的连续时间分析视角，研究离散时间问题，提出了一个连续时间、无需参数算法，并开发了一个类似的离散算法，最后提出了一个任意时间的算法以应对最难情况，并给出了一些令人满意的实验证据。

Jun, 2022

利用 PDE 方法从两个依赖于历史的专家建议预测二进制序列

本文研究通过在线机器学习的技术，建立了一个 “股票预测问题” 的模型，探讨了投资者和市场策略，并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。

Jul, 2020

朝着专家建议预测的最优算法

本文研究了在对手设置下采用几何停止时间进行专家建议的预测经典问题。对于 2 个专家的情况，Cover 提出了最优算法。对于三个专家的情况，我们设计了最优算法和对手，并证明了该算法与一个特定的随机对手的概率匹配算法（类似于汤普森抽样）是最优的，该证明显示概率匹配算法不仅针对这个特定的随机对手是最优的，而且是极小化的。同时我们通过主对偶（primal-dual) 方法同时发展了上限和下限，并为任意数量的专家设计了最优算法和对手的通用框架。

Sep, 2014

基于潜在能量的几何停止版本预测与专家建议的新界限

本文基于最优控制理论的验证论证，扩展了最近开发的在线预测机器学习问题的潜力框架至随机（几何）停止版本，并通过不同类型的策略，构建了一系列随机版本的潜力函数，从而更加准确地预测问题的结果。

Dec, 2019

两个专家的最佳即时遗憾

研究专家建议的预测问题，设计了迄今为止首个最小化后悔的最小极大算法，通过随机微积分的思想并考虑一个连续问题的模拟来解决。

Feb, 2020