多标签分类中基于宏 $K$ 指标的一致算法

ICLRJan, 2024

多标签分类中基于宏 $K$ 指标的一致算法

Consistent algorithms for multi-label classification with macro-at-$k$ metrics

Erik Schultheis, Wojciech Kotłowski, Marek Wydmuch, Rohit Babbar, Strom Borman...

TL;DR在多标签分类的人口效用框架下，我们考虑复杂性能度量的优化问题。我们主要关注一种指标，它线性可分解为对每个标签分别应用的二分类效用的总和，并对每个实例预测出恰好 k 个标签。这些 “宏 - at-$k$” 指标在具有长尾标签的极端分类问题中具有理想的性质。遗憾的是，at-$k$ 约束将原本相互独立的二分类任务耦合起来，导致优化问题比标准的宏平均更具挑战性。我们提供了一个统计框架来研究这个问题，证明了最优分类器的存在和形式，并基于 Frank-Wolfe 方法提出了一个统计一致且实用的学习算法。有趣的是，我们的主要结果还涉及非线性函数的更一般度量，这些函数是标签混淆矩阵的函数。实证结果证明了所提方法的竞争性能。

Abstract

We consider the optimization of complex performance metrics in multi-label classification under the population utility framework. We mainly focus on metrics linearly decomposable into a sum of binary classificati

optimization complex performance metrics multi-label classification macro-at-$k$ metrics frank-wolfe method

发现论文，激发创造

优化复杂绩效指标的通用在线算法

我们介绍和分析了一种通用的在线算法，适用于二元、多类和多标签分类问题中的各种复杂性能指标，该算法的更新和预测规则简单且计算效率高，无需存储任何过去的数据，而且对于凹函数和平滑度函数达到了 O (ln n/n) 的遗憾，并通过实证研究验证了所提算法的效率。

Jun, 2024

极端多标签分类中长尾性能的广义测试工具

在极端多标签分类中，通过对大量可能标签中选择一小部分相关标签来解决长尾标签问题，采用了预算 “在 k” 的广义度量方法并利用块协调上升算法，取得了在长尾性能方面有希望的结果。

Nov, 2023

宏平均 F1 和宏平均 F1

研究比较了两种计算 “宏 F1” 度量的公式，发现只有在稀有情况下这两种计算方法才可以被视为等价的，主要由于一种公式更重视产生偏向错误类型分布的分类器，这两种计算方法不仅在标量结果上会产生不同的结果，还会导致不同的分类器排名。

Nov, 2019

在线度量算法的混合预测

本文阐述了一种基于多种算法或预测器的学习增强在线算法技术，通过针对在线问题的分析，设计出与动态组合相竞争的算法，能够在多种预测器之间切换，具有灵活性和实用性。

Apr, 2023

优化 Top-k 曲线下面积的部分：理论与实践

本文提出了一种新的度量标准，名为 partial AUTKC，可以更好地区分不同分类。同时，论文还提出了一种用于优化该度量标准的框架，并在四个基准数据集上进行了实验证明其有效性。

Sep, 2022

具有 Karmic、阈值拟凸度量的二元分类

提出了两个关键特性：所谓的 Karmic 属性和阈值准凸性属性，表明 Bayes 最优分类器是正类条件概率的阈值函数，并借此结果通过新颖的阈值估计器提供了一个计算实际的插件分类器，并进一步提供了性能复杂度统计分析。

Jun, 2018

探究多标签学习中宏平均 AUC 的泛化能力

本文旨在理解和解决多标签学习中常用的宏平均（Macro-AUC）评价指标的理论问题。通过对 PASCAL VOC、Yahoo、和 MS COCO 数据集的实验结果和理论分析，发现数据集的类别不平衡是影响宏平均评价指标泛化范围的关键因素，并提出一种更通用的 McDiarmid 型浓度不等式。结果表明，相较于基于单变量损失函数的算法，基于成对损失函数和重新加权的损失函数更加稳健。

May, 2023

利用多标记评估指标的反单调性诱导多标记规则

本文研究了多标签头的归纳规则中标签组合数目随标签数量呈指数级增长的挑战性，并测试了多标签评估指标是否满足抗单调性和可分解性等性质，以便于用于多标签头的规则挖掘。

Dec, 2018

Top-k 分类与基数感知预测

我们研究了 top-k 分类的细节，该任务是预测输入的 $k$ 个可能的类别，超越单一分类预测。我们证明了多类别分类中的几种普遍代理损失函数，如 comp-sum 和约束损失，具有相对于 top-k 损失的 H 一致性界限。这些界限保证了与假设集 $H$ 相关的一致性，提供比贝叶斯一致性更强的保证，因为它们是非渐近和假设集特定的。为了解决准确性和基数 $k$ 之间的权衡，我们进一步通过实例依赖的成本敏感学习引入了基数感知的损失函数。对于这些函数，我们得到了成本敏感的 comp-sum 和约束代理损失，建立了它们的 H 一致性界限和贝叶斯一致性。最小化这些损失会导致新的基数感知算法应用于 top-k 分类。我们报道了在 CIFAR-100、ImageNet、CIFAR-10 和 SVHN 数据集上的大量实验证明了这些算法的有效性和好处。

Mar, 2024

连续多类标记方法和算法

本文研究了基于度量交互势能的连续域图像标注问题的凸松弛问题，提出了两种不同的凸松弛方法并通过 Douglas-Rachford 迭代方案求解离散问题，结果在合成和实际图像上都表现出了优良性能，在非标准势能情况下，结合创新二值化技术能够恒定的恢复出图像标注的离散解。

Feb, 2011