最大交换后悔的预测的校准序列,K1 校准误差和 MSR 松弛,经济实用性的讨论
Apr, 2024
本文考虑了基于二元事件的预测评估问题,并明确表明单一评分规则不能保证对所有可能的代理人低后悔,但已校准的预测保证所有代理人罕见子线性后悔,并提出了一种新的度量标准 U - 校准来评估预测,该标准是当受到任何有界评分规则的评估时,预测序列的最大后悔。
Jun, 2023
我们开发了一种用于在线线性回归的算法,即使在完全没有先验知识的情况下,也能实现最佳的静态和动态遗憾保证。
May, 2024
该文介绍了一种算法,可以在任何时间段内对任何字符串进行零误差预测,同时在总体上得到小的遗憾值,并将这种算法扩展到 $N$ 个专家的一般情况。
Aug, 2010
本文研究了预测中的不同类型自适应(非固定的)对手的强度,使用新概念的策略遗憾去衡量玩家的表现,特别关注记忆和切换成本的自适应对手,具有均摊 2/3 次幂的速率且强度显著较弱。
Feb, 2013
该研究探讨了带有正负回报的顺序预测游戏中外部遗憾的问题,应用了加权平均预测和不同乘法更新规则的新预测方法,并得到了更精确的遗憾界限。
Feb, 2006
在线版本的双边贸易问题中,引入全局预算平衡的概念,为对抗性输入提供了首个无悔算法,其中包括全反馈模型和部分反馈模型下的回报衡量标准。
Oct, 2023
研究随机多臂老虎机问题的性质和限制,探讨具有在线探索特性的预测器的表现,其中简单后悔被评估,讨论简单后悔与累计后悔的关系,在有限臂数的情况下展示了一种性能下限和预测器的上限后悔,并针对连续老虎臂问题进行了研究。
Feb, 2008
在线学习不仅仅是记住一切。通过使用自适应在线学习中近期开发的技术重新审视折扣遗憾的经典概念,我们提出了一个能够优雅地在新数据到达时遗忘历史的关键算法,改进了传统的非自适应算法,即使用固定学习率的梯度下降算法。具体而言,我们的理论保证不需要任何除了凸性之外的结构假设,该算法在次优超参数调整时可以证明是鲁棒的。通过在线符合预测,我们进一步展示了这些好处,它是一个具有集合成员决策的下游在线学习任务。
Feb, 2024
在线校准预测二进制序列的基本问题的关键是应用推理,游戏理论和算法研究序列预测的校准性能,本研究通过引入新的游戏,加强和改进了现有算法,并提出了新的下界,从而改善以前的上界。
Jun, 2024