为所有下游代理商预测换手遗憾 | BriefGPT - AI 论文速递

Feb, 2024

为所有下游代理商预测换手遗憾

Forecasting for Swap Regret for All Downstream Agents

Aaron Roth, Mirah Shi

TL;DR通过提供非校准但在一系列事件中无偏的预测，我们可以以较快的速度保证任意下游代理的降低交换后悔，同时保持我们的预测算法在不需要了解其效用函数的情况下为任何下游代理提供保证。

Abstract

We study the problem of making predictions so that downstream agents who best respond to them will be guaranteed diminishing swap regret,

predictions swap regret calibrated forecasts downstream agents dimensionality

发现论文，激发创造

预测最小化所有收益有限任务的调换遗憾

最大交换后悔的预测的校准序列，K1 校准误差和 MSR 松弛，经济实用性的讨论

Apr, 2024

未知代理预测的 U 校准

本文考虑了基于二元事件的预测评估问题，并明确表明单一评分规则不能保证对所有可能的代理人低后悔，但已校准的预测保证所有代理人罕见子线性后悔，并提出了一种新的度量标准 U - 校准来评估预测，该标准是当受到任何有界评分规则的评估时，预测序列的最大后悔。

Jun, 2023

动态环境下的在线线性回归与折扣

我们开发了一种用于在线线性回归的算法，即使在完全没有先验知识的情况下，也能实现最佳的静态和动态遗憾保证。

May, 2024

无损预测策略

该文介绍了一种算法，可以在任何时间段内对任何字符串进行零误差预测，同时在总体上得到小的遗憾值，并将这种算法扩展到 $N$ 个专家的一般情况。

Aug, 2010

具有切换成本和其他自适应对手的在线学习

本文研究了预测中的不同类型自适应（非固定的）对手的强度，使用新概念的策略遗憾去衡量玩家的表现，特别关注记忆和切换成本的自适应对手，具有均摊 2/3 次幂的速率且强度显著较弱。

Feb, 2013

使用专家建议的预测的改进二阶界限

该研究探讨了带有正负回报的顺序预测游戏中外部遗憾的问题，应用了加权平均预测和不同乘法更新规则的新预测方法，并得到了更精确的遗憾界限。

Feb, 2006

全局预算平衡下的双边贸易中无懊悔学习

在线版本的双边贸易问题中，引入全局预算平衡的概念，为对抗性输入提供了首个无悔算法，其中包括全反馈模型和部分反馈模型下的回报衡量标准。

Oct, 2023

多臂赌博问题的纯探索

研究随机多臂老虎机问题的性质和限制，探讨具有在线探索特性的预测器的表现，其中简单后悔被评估，讨论简单后悔与累计后悔的关系，在有限臂数的情况下展示了一种性能下限和预测器的上限后悔，并针对连续老虎臂问题进行了研究。

Feb, 2008

折扣自适应在线预测

在线学习不仅仅是记住一切。通过使用自适应在线学习中近期开发的技术重新审视折扣遗憾的经典概念，我们提出了一个能够优雅地在新数据到达时遗忘历史的关键算法，改进了传统的非自适应算法，即使用固定学习率的梯度下降算法。具体而言，我们的理论保证不需要任何除了凸性之外的结构假设，该算法在次优超参数调整时可以证明是鲁棒的。通过在线符合预测，我们进一步展示了这些好处，它是一个具有集合成员决策的下游在线学习任务。

Feb, 2024

通过更强的符号保持游戏改进校准的界限

在线校准预测二进制序列的基本问题的关键是应用推理，游戏理论和算法研究序列预测的校准性能，本研究通过引入新的游戏，加强和改进了现有算法，并提出了新的下界，从而改善以前的上界。

Jun, 2024