本文证明了 Blackwell 可接近性定理在具有向量回报的两人博弈中的等效性,并且提出了计算校准预测的第一个有效算法。
Nov, 2010
ML 预测模型需要是可靠的和值得信赖的,这通常意味着它们需要输出校准后的概率。本文介绍了一种使用布莱克韦尔可达定理的技术,将可能不具备校准性的在线预测模型转变为校准的预测模型,而原始模型的损失不会显著增加。我们提出的算法在在线环境中实现了比现有技术(arXiv:1607.03594)更快的校准和准确性,并且是第一个在在线环境中提供校准误差和准确性灵活权衡的算法。通过使用我们的技术来描述可同时实现校准和后悔的空间,我们证明了这一点。
Oct, 2023
本文提出了预测 Blackwell 可达性算法的概念,基于在线凸优化的后悔最小化算法,得到了针对多次博弈问题的多种算法,并在 18 个经典的零和博弈模型上的实验中取得了优秀的效果。
Jul, 2020
证明 Abernethy 等人的转化不能保持收敛速度,但可以将任何 approachability 实例紧密转化为 improper phi-regret minimization 实例,在 line 性转换的情况下可以保持收敛速度。
Jun, 2024
本研究探讨了一类广泛问题的在线可学性,并将其扩展到远超过外部遗憾的性能评估简单规范。我们的框架同时捕捉了其他著名规范,例如内部和一般 Phi 规范、学习使用非加性全局成本函数、Blackwell 的可挑战性、预测者的校准、自适应遗憾等。我们展示了在所有这些情况下的可学习性归因于控制相同的三个量:马田哥小定理收敛项、如果已知未来则能够表现良好的能力描述项、以及顺序 Rademacher 复杂性的概括,该复杂性在 (Rakhlin, Sridharan, Tewari, 2010) 中得到研究。由于我们直接研究问题的复杂性,而不是专注于高效算法的开发,因此我们能够改进和扩展许多已知结果,这些结果之前是通过算法构造推导出来的。
通过适应性算法的考虑以确保比修改行为所能达到的结果更好,我们可以基于相关学习动态产生新的博弈理论分析,这样做比基于平衡策略算法更加有效,因为前者可以处理非零和多人博弈问题。我们重新审视了博弈理论中的中介均衡和偏差类型,证明了没有可行的概念包含所有其他类型,并引出了一个追溯与规避策略算法的平衡类别的定义。
Dec, 2020
本文提出了一种基于线性规划优化问题的方法来平衡推荐系统或搜索问题中多种类别需要协调的目标,通过学习一个双重随机矩阵来实现权衡与适应,最终实验结果表明该模型可以取得更好的平衡效果。
Apr, 2023
本论文探讨了在不同人群中最小化误差差异和维护校准概率估计之间的紧张关系,并表明校准只与单一误差约束兼容。
Sep, 2017
机器学习关于预测,然而预测的有效性仅通过其评估得以体现。我们展示了校准和遗憾在评估预测中的概念等价性,并将评估问题构建为一个预测者、赌徒和自然之间的博弈。通过对赌徒和预测者施加直观限制,校准和遗憾自然而然地出现在这个框架中。此外,这个博弈将预测评估与结果的随机性联系起来。相对于预测而言,关于结果的随机性相当于关于结果的良好预测。我们将这两个方面,校准和遗憾,预测性和随机性,称为预测幸福的四个方面。
Jan, 2024
提出了一种基于数据的计算法和隐私保障的新框架,用于算法救济,并通过实证研究和理论分析证明了该框架的优越性,使用户能够在数据流形中找到改变预测结果的方向。
Jun, 2023