重新审视层次文本分类：推理与度量

Oct, 2024

重新审视层次文本分类：推理与度量

Revisiting Hierarchical Text Classification: Inference and Metrics

Roman Plaud, Matthieu Labeau, Antoine Saillenfest, Thomas Bonald

TL;DR本研究解决了层次文本分类（HTC）评估中的传统标签分类方法带来的局限性，提出基于特定设计的层次度量进行评估。通过引入新数据集并与各种基线模型进行比较，发现一些简单的基线在性能上与最新模型具有竞争力，强调了在HTC中新方法评估的重要性。

Abstract

Hierarchical Text Classification (HTC) is the task of assigning labels to a text within a structured space organized as a hierarchy. Recent works treat HTC as a conventional multilabel classification problem, therefore evaluating it as such. We instead propose to evaluate models based

发现论文，激发创造

基于强化标签分配的层次文本分类

该论文提出使用深度强化学习的方法学习标签分配策略，探索标签的层次结构，并在训练和推断时进行一致的探索决策，以提高层次文本分类的性能。实验结果表明，该方法平均提高了33.4％的宏平均F1得分，并且在五个公共数据集上优于现有的最先进的层次文本分类方法。

Aug, 2019

CoPHE：一种针对大规模多标签文本分类的计数保留分层评估指标

本研究提出一种基于层次结构的多标签文本分类方法，特别是针对ICD-9编码任务中的结构问题，使用本体论表示法来提高模型性能。

Sep, 2021

层次文本分类的约束序列到树生成

本文提出一种基于序列生成的序列到树框架（Seq2Tree）用于建模层次标签结构的方法，在约束解码策略的基础上，使用动态词汇来保证结果的标签一致性，相较于以往的方法，在三个基准数据集上实现了显著且一致的改进。

Apr, 2022

HPT: 针对分层文本分类的层次感知提示调整

本研究提出了一种分层感知提示调节方法（HPT）来处理多标签文本分类（HTC），通过构建动态虚拟模板和标记词，融合标记层次结构知识并引入零界多标签交叉熵损失，以提高预训练语言模型在HTC领域的性能，实验结果表明 HPT 在三组常用数据集上均取得了最先进的表现，能够有效地处理平衡不足和低资源情况。

Apr, 2022

利用全局和局部层次结构进行层次文本分类

本研究提出了一个使用 Hierarchy-guided BERT with Global and Local hierarchies (HBGL) 方法来处理层级文本分类中的全局和本地层次结构，并将其应用于三个基准数据集，取得显著的改善。

May, 2022

HiTIN: 面向分层文本分类的层次感知树同构网络

本文提出了Hierarchy-aware Tree Isomorphism Network (HiTIN) 模型，该模型仅利用标签层次的句法信息增强文本表示，并成功在多个数据集上实现了良好的表现和更少的内存消耗。

May, 2023

层次多标签文本分类的最新进展：一项综述

本文综述了层次化多标签文本分类的最新进展，包括开源数据集、主要方法、评估指标、学习策略和当前面临的挑战，并列举了一些未来的研究方向，以便社区进一步改进该领域。

Jul, 2023

HiGen: 基于层次的层次文本分类序列生成

提出了一种基于语言模型的文本生成框架HiGen来解决多标签文本分类下的层次分类问题，通过动态文本表示方法和层级引导的损失函数，结合任务特定的预训练策略，处理数据和减轻类别不平衡问题，在ENZYME、WOS和NYT数据集上展示出优越性能。

Jan, 2024

HiLight：一种具有层次感知的轻量级全局模型和层次局部对比学习

该研究解决了层次文本分类中现有模型在处理大规模分类层次时参数急剧增加的问题。提出了一种名为层次局部对比学习（HiLCL）的新学习任务，以高效引入层次信息。实验结果表明，HiLight模型在保持轻量化的同时，依然能够有效地进行层次文本分类。

Aug, 2024

层次文本分类中的文本-标签对齐建模

本研究解决了现有层次文本分类方法中，文本与标签对齐动态性不足的问题。提出的文本-标签对齐损失（TLA）通过对比学习，实现文本与正标签的紧密对齐，同时远离负标签，大大增强了文本表示与相关标签之间的关联性。实验结果表明，基于此框架的层次文本-标签对齐模型（HTLA）在基准数据集上取得了显著效果，展现出对层次文本分类的潜在影响。

Sep, 2024