深度极端多标签学习

Apr, 2017

Deep Extreme Multi-label Learning

Wenjie Zhang, Junchi Yan, Xiangfeng Wang, Hongyuan Zha

TL;DR该论文提出了一种利用非线性嵌入和基于图先验的标签空间建模相结合的实用深度嵌入方法，以解决规模庞大的标签空间问题，并在多个公共数据集上进行了实验。

Abstract

extreme multi-label learning (XML) or classification has been a practical and important problem since the boom of big data. The main challenge lies in the exponential label space which involves $2^L$ possible lab

extreme multi-label learning deep learning label space non-linear embedding graph priors

发现论文，激发创造

轻量级深度极端多标签分类

本文提出一种名为 LightDXML 的方法来解决极端多标签分类的问题，使用标签嵌入代替特征嵌入进行负采样，并通过三个主要阶段迭代训练，从而在保持时间和内存要求的同时，达到与深度学习方法相当的预测准确性。

Apr, 2023

基于排序的自编码器极端多标签分类

本文提出了基于深度学习的 XML 方法，采用基于词向量的自注意力和基于排序的自编码器，不仅能处理特征和标签之间的依赖关系，同时也可以考虑标签之间的依赖关系，该方法在标准数据集上表现优异。

Apr, 2019

DeepXML：一种应用于短文本文档的深度极端多标签学习框架

本文介绍了 DeepXML 框架，它将深度极端多标签任务分解成四个简单的子任务，可以在公共短文本数据集上比领先的深度极端分类器更准确和更快地训练，并可用于 Bing 搜索引擎等多个应用。

Nov, 2021

多标签学习新趋势

本文针对大数据时代下的多标签学习，总结分析了现有研究以及未来发展方向和应用前景。

Nov, 2020

无后悔泛化的分层 softmax 算法在极端多标签分类中的应用

本文中，我们探究了处理极端多标记分类问题的概率标记树（PLTs），并通过实现 extremeText（XT）来证明 PLTs 在 precision@k 指标下是一个 HSM 的无遗憾多标签泛化。同时，我们证明了 pick-one-label 启发式算法在一般情况下不是一致的，我们的实现方法比使用 pick-one-label 的 HSM 和专门为 XMLC 问题设计的神经网络 XML-CNN 得到的结果更好。此外，XT 在统计性能、模型大小和预测时间等方面与许多最先进的方法相当，适合部署在在线系统中。

Oct, 2018

利用大型语言模型进行极端多标签技能抽取训练

通过使用大型语言模型，本研究提出了一种成本有效的方法来生成准确、全合成的技能提取的标签数据集，并提出了一种对比学习策略，证明其在任务中的有效性。在三个技能提取基准测试中，我们的结果显示，与仅依赖于远程监督的字面匹配的先前发布结果相比，R-Precision@5 提高了 15 至 25 个百分点。

Jul, 2023

MatchXML：一种高效的文本标签匹配框架用于极端多标签文本分类

通过提出 MatchXML 框架，我们在 eXtreme Multi-label text Classification 领域取得了 state-of-the-art 的准确率和速度，其中关键技术包括 label embeddings、Hierarchical Label Tree 和 linear ranker。

Aug, 2023

极端多标签学习的本地非线性嵌入

本文介绍了 X-One 分类器，其使用小型本地距离保存嵌入，可以准确预测罕见（尾部）标签的聚合，提高了分类准确性，可有效且较之于嵌入法和树法的现有极端多标签分类算法，对于拥有百万标签的数据集也能高效扩展。

Jul, 2015

ICXML: 零样本极度多标签分类的上下文学习框架

本文研究极端多标记分类（XMC）任务，提出了一种使用上下文学习方法的 In-Context Extreme Multilabel Learning（ICXML）框架，通过生成候选标签集并对其进行排名，进一步提升了 XMC 领域的研究进展。

Nov, 2023

极端多标记分类的概率标记树

本研究详细研究了概率标签树 (PLTs) 作为多标记问题中的分层 softmax 的一般化方法，考虑了在线学习的问题，证明了他们的相容性，提出了一种新的 PLTs 实现，并通过实验证明了它的有效性。

Sep, 2020