Jan, 2024

HiGen: 基于层次的层次文本分类序列生成

TL;DR提出了一种基于语言模型的文本生成框架 HiGen 来解决多标签文本分类下的层次分类问题,通过动态文本表示方法和层级引导的损失函数,结合任务特定的预训练策略,处理数据和减轻类别不平衡问题,在 ENZYME、WOS 和 NYT 数据集上展示出优越性能。