可接近性、遗憾和校准；意义和等效性

Jan, 2013

可接近性、遗憾和校准；意义和等效性

Approachability, Regret and Calibration; implications and equivalences

Vianney Perchet

TL;DR探讨三个标准（Blackwell 可达性，遗憾最小化和校准）如何在不同的顺序决策问题或玩家与自然之间的重复游戏中评估策略，并将其应用于展现一种新的直观算法类，基于简单的几何特性。

Abstract

blackwell approachability, regret minimization and calibration are three criteria evaluating a strategy (or an algorithm) in different seq

blackwell approachability regret minimization calibration sequential decision problems repeated games

发现论文，激发创造

黑韦尔可到达性与低遗憾学习是等效的

本文证明了 Blackwell 可接近性定理在具有向量回报的两人博弈中的等效性，并且提出了计算校准预测的第一个有效算法。

Nov, 2010

通过可袭近性实现在线预测器的快速再校准

ML 预测模型需要是可靠的和值得信赖的，这通常意味着它们需要输出校准后的概率。本文介绍了一种使用布莱克韦尔可达定理的技术，将可能不具备校准性的在线预测模型转变为校准的预测模型，而原始模型的损失不会显著增加。我们提出的算法在在线环境中实现了比现有技术（arXiv:1607.03594）更快的校准和准确性，并且是第一个在在线环境中提供校准误差和准确性灵活权衡的算法。通过使用我们的技术来描述可同时实现校准和后悔的空间，我们证明了这一点。

Oct, 2023

预测性布莱克韦尔可达性加速游戏求解：联接遗憾匹配与镜像下降

本文提出了预测 Blackwell 可达性算法的概念，基于在线凸优化的后悔最小化算法，得到了针对多次博弈问题的多种算法，并在 18 个经典的零和博弈模型上的实验中取得了优秀的效果。

Jul, 2020

黑韦尔可达性的速率保持减缩

证明 Abernethy 等人的转化不能保持收敛速度，但可以将任何 approachability 实例紧密转化为 improper phi-regret minimization 实例，在 line 性转换的情况下可以保持收敛速度。

Jun, 2024

在线学习：超越遗憾

本研究探讨了一类广泛问题的在线可学性，并将其扩展到远超过外部遗憾的性能评估简单规范。我们的框架同时捕捉了其他著名规范，例如内部和一般 Phi 规范、学习使用非加性全局成本函数、Blackwell 的可挑战性、预测者的校准、自适应遗憾等。我们展示了在所有这些情况下的可学习性归因于控制相同的三个量：马田哥小定理收敛项、如果已知未来则能够表现良好的能力描述项、以及顺序 Rademacher 复杂性的概括，该复杂性在 (Rakhlin, Sridharan, Tewari, 2010) 中得到研究。由于我们直接研究问题的复杂性，而不是专注于高效算法的开发，因此我们能够改进和扩展许多已知结果，这些结果之前是通过算法构造推导出来的。

Nov, 2010

相关对局的回顾性和序贯理性

通过适应性算法的考虑以确保比修改行为所能达到的结果更好，我们可以基于相关学习动态产生新的博弈理论分析，这样做比基于平衡策略算法更加有效，因为前者可以处理非零和多人博弈问题。我们重新审视了博弈理论中的中介均衡和偏差类型，证明了没有可行的概念包含所有其他类型，并引出了一个追溯与规避策略算法的平衡类别的定义。

Dec, 2020

ExCalibR: 推荐期望校准

本文提出了一种基于线性规划优化问题的方法来平衡推荐系统或搜索问题中多种类别需要协调的目标，通过学习一个双重随机矩阵来实现权衡与适应，最终实验结果表明该模型可以取得更好的平衡效果。

Apr, 2023

公正和校准

本论文探讨了在不同人群中最小化误差差异和维护校准概率估计之间的紧张关系，并表明校准只与单一误差约束兼容。

Sep, 2017

预测成功的四个方面：校准性、预测能力、随机性和遗憾

机器学习关于预测，然而预测的有效性仅通过其评估得以体现。我们展示了校准和遗憾在评估预测中的概念等价性，并将评估问题构建为一个预测者、赌徒和自然之间的博弈。通过对赌徒和预测者施加直观限制，校准和遗憾自然而然地出现在这个框架中。此外，这个博弈将预测评估与结果的随机性联系起来。相对于预测而言，关于结果的随机性相当于关于结果的良好预测。我们将这两个方面，校准和遗憾，预测性和随机性，称为预测幸福的四个方面。

Jan, 2024

成功的简单步骤：基于距离的算法回溯公理

提出了一种基于数据的计算法和隐私保障的新框架，用于算法救济，并通过实证研究和理论分析证明了该框架的优越性，使用户能够在数据流形中找到改变预测结果的方向。

Jun, 2023