Jan, 2024
HiGen: 基于层次的层次文本分类序列生成
HiGen: Hierarchy-Aware Sequence Generation for Hierarchical Text Classification
Vidit Jain, Mukund Rungta, Yuchen Zhuang, Yue Yu, Zeyu Wang...
TL;DR提出了一种基于语言模型的文本生成框架 HiGen 来解决多标签文本分类下的层次分类问题,通过动态文本表示方法和层级引导的损失函数,结合任务特定的预训练策略,处理数据和减轻类别不平衡问题,在 ENZYME、WOS 和 NYT 数据集上展示出优越性能。