轻量级深度极端多标签分类
采用生成协同网络来实现端到端训练和动态负面标签抽样的 LightXML,解决了现存方法中需要组合多个模型训练和过程中静态采样负面标签等问题,在五个极端多标签数据集中验证实验证明,LightXML 比 AttentionXML 等方法具有更小的模型大小和较低的计算复杂度。
Jan, 2021
本文提出了基于深度学习的 XML 方法,采用基于词向量的自注意力和基于排序的自编码器,不仅能处理特征和标签之间的依赖关系,同时也可以考虑标签之间的依赖关系,该方法在标准数据集上表现优异。
Apr, 2019
本文介绍了 DeepXML 框架,它将深度极端多标签任务分解成四个简单的子任务,可以在公共短文本数据集上比领先的深度极端分类器更准确和更快地训练,并可用于 Bing 搜索引擎等多个应用。
Nov, 2021
CascadeXML 是一种端到端的多分辨率学习流程,利用 transformer 模型的多层架构来应对不同的标签分辨率,并为每个分辨率保留独立的特征表示。CascadeXML 在标签数高达三百万的基准数据集上取得了显著的性能提升,是现有方法的最优选择。
Oct, 2022
通过提出 MatchXML 框架,我们在 eXtreme Multi-label text Classification 领域取得了 state-of-the-art 的准确率和速度,其中关键技术包括 label embeddings、Hierarchical Label Tree 和 linear ranker。
Aug, 2023
本文中,我们探究了处理极端多标记分类问题的概率标记树(PLTs),并通过实现 extremeText(XT)来证明 PLTs 在 precision@k 指标下是一个 HSM 的无遗憾多标签泛化。同时,我们证明了 pick-one-label 启发式算法在一般情况下不是一致的,我们的实现方法比使用 pick-one-label 的 HSM 和专门为 XMLC 问题设计的神经网络 XML-CNN 得到的结果更好。此外,XT 在统计性能、模型大小和预测时间等方面与许多最先进的方法相当,适合部署在在线系统中。
Oct, 2018
本研究详细研究了概率标签树 (PLTs) 作为多标记问题中的分层 softmax 的一般化方法,考虑了在线学习的问题,证明了他们的相容性,提出了一种新的 PLTs 实现,并通过实验证明了它的有效性。
Sep, 2020
本文研究极端多标记分类(XMC)任务,提出了一种使用上下文学习方法的 In-Context Extreme Multilabel Learning(ICXML)框架,通过生成候选标签集并对其进行排名,进一步提升了 XMC 领域的研究进展。
Nov, 2023