深度极端多标签学习
本文提出一种名为 LightDXML 的方法来解决极端多标签分类的问题,使用标签嵌入代替特征嵌入进行负采样,并通过三个主要阶段迭代训练,从而在保持时间和内存要求的同时,达到与深度学习方法相当的预测准确性。
Apr, 2023
本文提出了基于深度学习的 XML 方法,采用基于词向量的自注意力和基于排序的自编码器,不仅能处理特征和标签之间的依赖关系,同时也可以考虑标签之间的依赖关系,该方法在标准数据集上表现优异。
Apr, 2019
本文介绍了 DeepXML 框架,它将深度极端多标签任务分解成四个简单的子任务,可以在公共短文本数据集上比领先的深度极端分类器更准确和更快地训练,并可用于 Bing 搜索引擎等多个应用。
Nov, 2021
本文中,我们探究了处理极端多标记分类问题的概率标记树(PLTs),并通过实现 extremeText(XT)来证明 PLTs 在 precision@k 指标下是一个 HSM 的无遗憾多标签泛化。同时,我们证明了 pick-one-label 启发式算法在一般情况下不是一致的,我们的实现方法比使用 pick-one-label 的 HSM 和专门为 XMLC 问题设计的神经网络 XML-CNN 得到的结果更好。此外,XT 在统计性能、模型大小和预测时间等方面与许多最先进的方法相当,适合部署在在线系统中。
Oct, 2018
通过使用大型语言模型,本研究提出了一种成本有效的方法来生成准确、全合成的技能提取的标签数据集,并提出了一种对比学习策略,证明其在任务中的有效性。在三个技能提取基准测试中,我们的结果显示,与仅依赖于远程监督的字面匹配的先前发布结果相比,R-Precision@5 提高了 15 至 25 个百分点。
Jul, 2023
通过提出 MatchXML 框架,我们在 eXtreme Multi-label text Classification 领域取得了 state-of-the-art 的准确率和速度,其中关键技术包括 label embeddings、Hierarchical Label Tree 和 linear ranker。
Aug, 2023
本文介绍了 X-One 分类器,其使用小型本地距离保存嵌入,可以准确预测罕见(尾部)标签的聚合,提高了分类准确性,可有效且较之于嵌入法和树法的现有极端多标签分类算法,对于拥有百万标签的数据集也能高效扩展。
Jul, 2015
本文研究极端多标记分类(XMC)任务,提出了一种使用上下文学习方法的 In-Context Extreme Multilabel Learning(ICXML)框架,通过生成候选标签集并对其进行排名,进一步提升了 XMC 领域的研究进展。
Nov, 2023
本研究详细研究了概率标签树 (PLTs) 作为多标记问题中的分层 softmax 的一般化方法,考虑了在线学习的问题,证明了他们的相容性,提出了一种新的 PLTs 实现,并通过实验证明了它的有效性。
Sep, 2020