May, 2017

在线预测问题的 PDE 方法:基于潜势的策略构建

TL;DR本研究中,我们考虑了一系列的重复预测游戏模型,并通过极限推导出非线性抛物型偏微分方程的超级解,这些超级解与 N.Cesa-Bianci,G.Lugosi(2003)所定义的潜力函数密切相关。所有这类超级解提供了预测者遗憾的上限界,同时表明了一个基于潜力的预测策略,能够满足 Blackwell 条件。通过验证论证,可以得出对于最坏情况下遗憾的常规上界。