CoPHE:一种针对大规模多标签文本分类的计数保留分层评估指标
本文提出了一种新的输入-标签模型,该模型利用标签语义和非线性输入标签嵌入来实现更好的文本分类性能,并通过跨语言和零资源的多语种文本分类实验证明了该模型的优越性。
Jun, 2018
该研究提出了一种名为LAHA的模型,该模型利用文本内容和标签关联性之间的语义关系,建立了一个显式的标签感知表征,特别是在尾标签的情况下,使得模型在非常大规模的标签集中的文本标记任务中表现出了卓越性能。
May, 2019
本文提出了一种使用超几何空间嵌入词汇和标签层次结构的方法来解决层级多标签分类问题。通过设计新的超球面交互模型,实现对标签感知的文档表示和HMLC预测,实验结果表明新模型相对于现有方法进一步提高了性能。
May, 2019
本研究在多个数据集上评估了多种Large-scale Multi-label Text Classification方法,发现基于概率标签树的层次分类方法优于Label-Wise Attention Networks。另外,结合Transformer的方法在两个数据集上实现了优秀的性能,同时提出了一种新的最先进的方法,将BERT与LWANs相结合。此外,还引入了图形感知注释接近度度量,提出了利用标签层次结构来改进少量和零-shot学习的新模型。
Oct, 2020
本研究提出了一种加强预训练模型和标签层次结构的方法(RLHR)来优化ZS-MTC任务,并设计了一个回滚算法来消除推理期间的逻辑错误,实验结果显示我们的方法在三个真实数据集上表现更好,优于之前的非预训练方法。
Apr, 2021
本文提出了一个基于有序神经LSTM网络的分层和微调方法,缩写为HFT-ONLSTM,以更准确地进行逐层HMTC。 联合嵌入的新方法,基于父类别标签和文本数据进行准确捕捉文本和类别标签的联合特征,采用微调技术来训练参数,以使得上层文本分类结果对下层分类贡献。 实验结果表明,我们的方法在减少计算成本的同时,实现了优越的性能,优于基于分层和平面多标签文本分类方法的最新技术水平。
Apr, 2022
本文提出了一种用于极端多标签文本分类的新型框架TReaderXML,它采用动态和细粒度的语义范围来优化每个文本的先验类别语义范围,通过新型的双协作网络来找到目标标签,实验结果表明我们的方法在三个XMLC基准数据集上达到了新的最佳表现。
May, 2022
本文提出了Hierarchy-aware Tree Isomorphism Network (HiTIN) 模型,该模型仅利用标签层次的句法信息增强文本表示,并成功在多个数据集上实现了良好的表现和更少的内存消耗。
May, 2023
本文综述了层次化多标签文本分类的最新进展,包括开源数据集、主要方法、评估指标、学习策略和当前面临的挑战,并列举了一些未来的研究方向,以便社区进一步改进该领域。
Jul, 2023
本研究解决了层次文本分类(HTC)评估中的传统标签分类方法带来的局限性,提出基于特定设计的层次度量进行评估。通过引入新数据集并与各种基线模型进行比较,发现一些简单的基线在性能上与最新模型具有竞争力,强调了在HTC中新方法评估的重要性。
Oct, 2024