重新审视层次文本分类:推理与度量
该论文提出使用深度强化学习的方法学习标签分配策略,探索标签的层次结构,并在训练和推断时进行一致的探索决策,以提高层次文本分类的性能。实验结果表明,该方法平均提高了33.4%的宏平均F1得分,并且在五个公共数据集上优于现有的最先进的层次文本分类方法。
Aug, 2019
本研究提出一种基于层次结构的多标签文本分类方法,特别是针对ICD-9编码任务中的结构问题,使用本体论表示法来提高模型性能。
Sep, 2021
本文提出一种基于序列生成的序列到树框架(Seq2Tree)用于建模层次标签结构的方法,在约束解码策略的基础上,使用动态词汇来保证结果的标签一致性,相较于以往的方法,在三个基准数据集上实现了显著且一致的改进。
Apr, 2022
本研究提出了一种分层感知提示调节方法(HPT)来处理多标签文本分类(HTC),通过构建动态虚拟模板和标记词,融合标记层次结构知识并引入零界多标签交叉熵损失,以提高预训练语言模型在HTC领域的性能,实验结果表明 HPT 在三组常用数据集上均取得了最先进的表现,能够有效地处理平衡不足和低资源情况。
Apr, 2022
本研究提出了一个使用 Hierarchy-guided BERT with Global and Local hierarchies (HBGL) 方法来处理层级文本分类中的全局和本地层次结构,并将其应用于三个基准数据集,取得显著的改善。
May, 2022
本文提出了Hierarchy-aware Tree Isomorphism Network (HiTIN) 模型,该模型仅利用标签层次的句法信息增强文本表示,并成功在多个数据集上实现了良好的表现和更少的内存消耗。
May, 2023
本文综述了层次化多标签文本分类的最新进展,包括开源数据集、主要方法、评估指标、学习策略和当前面临的挑战,并列举了一些未来的研究方向,以便社区进一步改进该领域。
Jul, 2023
提出了一种基于语言模型的文本生成框架HiGen来解决多标签文本分类下的层次分类问题,通过动态文本表示方法和层级引导的损失函数,结合任务特定的预训练策略,处理数据和减轻类别不平衡问题,在ENZYME、WOS和NYT数据集上展示出优越性能。
Jan, 2024
该研究解决了层次文本分类中现有模型在处理大规模分类层次时参数急剧增加的问题。提出了一种名为层次局部对比学习(HiLCL)的新学习任务,以高效引入层次信息。实验结果表明,HiLight模型在保持轻量化的同时,依然能够有效地进行层次文本分类。
Aug, 2024
本研究解决了现有层次文本分类方法中,文本与标签对齐动态性不足的问题。提出的文本-标签对齐损失(TLA)通过对比学习,实现文本与正标签的紧密对齐,同时远离负标签,大大增强了文本表示与相关标签之间的关联性。实验结果表明,基于此框架的层次文本-标签对齐模型(HTLA)在基准数据集上取得了显著效果,展现出对层次文本分类的潜在影响。
Sep, 2024