针对少样本分层文本分类的分层生成器

ACLMay, 2023

针对少样本分层文本分类的分层生成器

Hierarchical Verbalizer for Few-Shot Hierarchical Text Classification

Ke Ji, Yixin Lian, Jingsheng Gao, Baoyuan Wang

TL;DR此文提出了采用多 verbalizer 框架的层级文本分类方法以解决少样本低资源问题，该方法将标签层次结构嵌入到 verbalizer 中，显著优于采用图编码器注入层次结构的方法，结果表明此方案可极大地提高层级分类性能

Abstract

Due to the complex label hierarchy and intensive labeling cost in practice, the hierarchical text classification (HTC) suffers a poor performance especially when low-resource or few-shot settings are considered. Recently, there is a growing trend of applying prompts on →

hierarchical text classification pre-trained language models few-shot learning label hierarchy knowledge multiverbalizer framework

发现论文，激发创造

HPT: 针对分层文本分类的层次感知提示调整

本研究提出了一种分层感知提示调节方法（HPT）来处理多标签文本分类（HTC），通过构建动态虚拟模板和标记词，融合标记层次结构知识并引入零界多标签交叉熵损失，以提高预训练语言模型在 HTC 领域的性能，实验结果表明 HPT 在三组常用数据集上均取得了最先进的表现，能够有效地处理平衡不足和低资源情况。

Apr, 2022

检索式上下文学习用于少样本层次文本分类

本研究提出了第一个以预训练语言模型为基础的在语境学习框架来从检索数据库中识别相关演示，并采用迭代策略处理多层次层级标签的少样本分类任务，通过不同目标实现对输入文本的层级分类，得到优越的实验结果，在少样本的层次分类任务中取得了最先进的成果。

Jun, 2024

基于提示的少样本调优的原型话语生成器

提出了基于原型向量的语言预训练模型元素标定方法 ProtoVerb，使用对比学习算法在训练数据中学习原型向量作为元素标定器，显著优于现有自动元素标定器，特别是在数据稀缺场景下。ProtoVerb 即使在未调整的 PLMs 上也能提高基于提示的微调精度。

Mar, 2022

基于结构化语言知识的视觉 - 语言模型的层次化提示学习

本研究提出一种称为分层提示调整的新方法，利用大语言模型（LLMs）建立描述每个类别的图形模型，以模拟描述类别的实体和属性及其相关性，并通过引入关系引导注意模块来捕捉实体和属性之间的关联，以及通过结合整体语义建模来处理更复杂和长期的关系。实验结果表明，我们的方法具有很强的效果，并且比现有的最先进方法具有更好的泛化性能。

Dec, 2023

基于提示的少样本文本分类的进化语言生成搜索

本文提出了一种新的进化式口头表述搜索算法用于构建最优的口头表述器，在少量数据情况下使用预训练的语言模型以及任务特定提示能够极大地提高准确性，进一步推进了小样本文本分类的研究。

Jun, 2023

HiGen: 基于层次的层次文本分类序列生成

提出了一种基于语言模型的文本生成框架 HiGen 来解决多标签文本分类下的层次分类问题，通过动态文本表示方法和层级引导的损失函数，结合任务特定的预训练策略，处理数据和减轻类别不平衡问题，在 ENZYME、WOS 和 NYT 数据集上展示出优越性能。

Jan, 2024

基于强化标签分配的层次文本分类

该论文提出使用深度强化学习的方法学习标签分配策略，探索标签的层次结构，并在训练和推断时进行一致的探索决策，以提高层次文本分类的性能。实验结果表明，该方法平均提高了 33.4％的宏平均 F1 得分，并且在五个公共数据集上优于现有的最先进的层次文本分类方法。

Aug, 2019

从预训练语言模型中引发知识，以实现典型提示语言生成

本研究探讨了如何从预训练语言模型中提取知识，提出了一种基于原型的提示语言生成器，以优化模型并实现有效的零样本和少样本分类。

Jan, 2022

层次文本分类的约束序列到树生成

本文提出一种基于序列生成的序列到树框架（Seq2Tree）用于建模层次标签结构的方法，在约束解码策略的基础上，使用动态词汇来保证结果的标签一致性，相较于以往的方法，在三个基准数据集上实现了显著且一致的改进。

Apr, 2022

利用对抗性训练的本地层次化方法进行层次文本分类

本文介绍了一种基于对抗框架的本地层次结构，用于在几乎所有层次文本分类（HTC）模型中优化复杂的分类树形结构，实验证明该本地层次结构有助于处理复杂的分类树形结构并提高稀有类别的分类效果。

Feb, 2024