轻量级深度极端多标签分类

Apr, 2023

Light-weight Deep Extreme Multilabel Classification

Istasis Mishra, Arpan Dasgupta, Pratik Jawanpuria, Bamdev Mishra, Pawan Kumar

TL;DR本文提出一种名为 LightDXML 的方法来解决极端多标签分类的问题，使用标签嵌入代替特征嵌入进行负采样，并通过三个主要阶段迭代训练，从而在保持时间和内存要求的同时，达到与深度学习方法相当的预测准确性。

Abstract

Extreme multi-label (XML) classification refers to the task of supervised multi-label learning that involves a large number of labels. Hence, scalability of the classifier with increasing label dimension is an important consideration. In this paper, we develop a method called LightDXML which modifies the recently developed →

extreme multi-label classification deep learning label embeddings negative sampling prediction accuracy

发现论文，激发创造

LightXML: 动态负采样的 Transformer 用于高性能极端多标签文本分类

采用生成协同网络来实现端到端训练和动态负面标签抽样的 LightXML，解决了现存方法中需要组合多个模型训练和过程中静态采样负面标签等问题，在五个极端多标签数据集中验证实验证明，LightXML 比 AttentionXML 等方法具有更小的模型大小和较低的计算复杂度。

Jan, 2021

深度极端多标签学习

该论文提出了一种利用非线性嵌入和基于图先验的标签空间建模相结合的实用深度嵌入方法，以解决规模庞大的标签空间问题，并在多个公共数据集上进行了实验。

Apr, 2017

基于排序的自编码器极端多标签分类

本文提出了基于深度学习的 XML 方法，采用基于词向量的自注意力和基于排序的自编码器，不仅能处理特征和标签之间的依赖关系，同时也可以考虑标签之间的依赖关系，该方法在标准数据集上表现优异。

Apr, 2019

DeepXML：一种应用于短文本文档的深度极端多标签学习框架

本文介绍了 DeepXML 框架，它将深度极端多标签任务分解成四个简单的子任务，可以在公共短文本数据集上比领先的深度极端分类器更准确和更快地训练，并可用于 Bing 搜索引擎等多个应用。

Nov, 2021

CascadeXML: 极端多标签分类的端到端多分辨率训练的 Transformer 重构

CascadeXML 是一种端到端的多分辨率学习流程，利用 transformer 模型的多层架构来应对不同的标签分辨率，并为每个分辨率保留独立的特征表示。CascadeXML 在标签数高达三百万的基准数据集上取得了显著的性能提升，是现有方法的最优选择。

Oct, 2022

MatchXML：一种高效的文本标签匹配框架用于极端多标签文本分类

通过提出 MatchXML 框架，我们在 eXtreme Multi-label text Classification 领域取得了 state-of-the-art 的准确率和速度，其中关键技术包括 label embeddings、Hierarchical Label Tree 和 linear ranker。

Aug, 2023

无后悔泛化的分层 softmax 算法在极端多标签分类中的应用

本文中，我们探究了处理极端多标记分类问题的概率标记树（PLTs），并通过实现 extremeText（XT）来证明 PLTs 在 precision@k 指标下是一个 HSM 的无遗憾多标签泛化。同时，我们证明了 pick-one-label 启发式算法在一般情况下不是一致的，我们的实现方法比使用 pick-one-label 的 HSM 和专门为 XMLC 问题设计的神经网络 XML-CNN 得到的结果更好。此外，XT 在统计性能、模型大小和预测时间等方面与许多最先进的方法相当，适合部署在在线系统中。

Oct, 2018

极端多标记分类的概率标记树

本研究详细研究了概率标签树 (PLTs) 作为多标记问题中的分层 softmax 的一般化方法，考虑了在线学习的问题，证明了他们的相容性，提出了一种新的 PLTs 实现，并通过实验证明了它的有效性。

Sep, 2020

倾向分数概率标签树

本研究提出一种基于 A * 搜索算法的推断过程，能够有效地解决了在极端多标签分类模型中标签分布不均、稀疏、缺失等问题，从而优化了分类预测效果。

Oct, 2021

ICXML: 零样本极度多标签分类的上下文学习框架

本文研究极端多标记分类（XMC）任务，提出了一种使用上下文学习方法的 In-Context Extreme Multilabel Learning（ICXML）框架，通过生成候选标签集并对其进行排名，进一步提升了 XMC 领域的研究进展。

Nov, 2023