一种公理化方法的损失汇总及适应性汇总算法

Jun, 2024

一种公理化方法的损失汇总及适应性汇总算法

An Axiomatic Approach to Loss Aggregation and an Adapted Aggregating Algorithm

Armando J. Cabrera Pacheco, Rabanus Derr, Robert C. Williamson

TL;DR针对在线学习推荐的一种变体聚合算法，该算法基于广义聚合函数，具有与 AA 相似的理论性质，如贝叶斯更新和对广义和损失的时间无关边界。

Abstract

supervised learning has gone beyond the expected risk minimization framework. Central to most of these developments is the introduction of more general aggregation functions for losses incurred by the learner. In

supervised learning aggregation functions online learning expert advice loss aggregation

发现论文，激发创造

Q - 聚合最优学习

研究具有强凸和 Lipschitz 损失的一般监督学习问题，研究模型选择集成问题。证明了 Q-aggregation 过程将产生期望和高概率上都满足最优 Oracle 不等式的估计器。

Jan, 2013

通用损失下的最优二分类器集成

本文旨在解决半监督二分类集合聚合问题，以最小化在未标记数据上产生的预测损失，并找到了一类最小 - 最大最优预测。结果是一组半监督集合聚合算法，能像线性学习一样高效，但无需放松任何限制。它们的决策规则采用决策理论中熟悉的形式，将 Sigmoid 函数应用于集合边缘的概念，而不需要通常在基于边缘的学习中做出的假设。

Oct, 2015

常数遗憾，广义可混合性和镜像下降

研究预测与专家建议，探讨误差函数选择和混合算法来达到常数后悔的预测结果。还提出广义聚合算法及其相应的混合损失函数，使用 Shannon 熵获得了最低的最差情况后悔率，并进一步提出了基于镜像下降算法的自适应聚合算法。

Feb, 2018

统计汇聚的本地风险界限

本文研究了聚合理论中的统计学设置，并通过用较小的局部复杂度替换全局复杂度来加强经典聚合理论的结果，包括基于 Leung 和 Barron 的指数权重估计器的局部经典简单限制，并针对 Q - 聚合估计器提出了偏差最优限制。

Jun, 2023

基于配对损失函数的在线学习

本文研究了在线学习算法中带有成对损失函数的泛化性能，并提出了一种数据依赖性较小的界限来衡量在线学习算法的平均风险产生的序列的模型偏差，同时针对常见的机器学习问题，如基于排名和监督度量学习提出了实际应用案例。

Jan, 2013

乐观自适应拉格朗日对冲

介绍了一种基于 Lagrangian hedging 的在线算法（包括 regret-matching 和 hedge），通过引入 optimism 和 adaptive step size 对非对抗性问题进行了优化，并给出了相应的性能界限。

Jan, 2021

贪心 Q 聚合的偏差优化学习

本研究提出了一种新的模型选择聚合算法 (Q-aggregation)，并实现了利用该算法构建精确稀疏聚合模型的贪婪 Q 聚合过程，在最小最大意义下实现了最优的神谕不等式。

Mar, 2012

指数最小平方损失贝叶斯模型平均

本文探讨采用贝叶斯估计器与指数化最小二乘损失来进行偏差最优的模型平均，通过建立两种方法之间的原始对偶关系并提出新的贪心方法，规避了现有 $Q$- 聚合算法的局限性。

Aug, 2014

关于损失和基于不确定性的主动学习算法的收敛性

我们研究了在各种假设下，损失和基于不确定性的主动学习算法的收敛速度。首先，我们给出了一组条件，用于线性分类器和线性可分数据集，以展示对基于损失采样和不同损失函数的收敛速度保证。其次，我们提供了一个框架，通过应用已知的随机梯度下降算法的收敛速度保证，来推导基于损失采样的收敛速度界限。最后，我们提出了一种主动学习算法，它结合了点采样和随机 Polyak 步长。我们展示了对平滑凸损失函数的此算法进行收敛速度保证的采样条件。我们的数值结果证明了我们提出的算法的效率。

Dec, 2023

基于回归的增强学习在线算法

本文介绍了在学习增强的在线算法中使用回归技术来预测未来输入参数的方法，并在广义滑雪租赁、装箱问题、最小完成时间调度等一般在线搜索方案的背景下探讨了这种方法。通过在设计回归问题的损失函数中结合在线优化基准，我们显示了这种回归问题样本复杂度的近似上下界，并将我们的结果扩展到了不可知设置。

May, 2022