SGM: 多标记分类的序列生成模型

COLINGJun, 2018

SGM: Sequence Generation Model for Multi-label Classification

Pengcheng Yang, Xu Sun, Wei Li, Shuming Ma, Wei Wu...

TL;DR本文提出将多标签分类任务视为序列生成问题，并应用具有新型解码器结构的序列生成模型来解决这个任务，实验结果表明我们的建议方法大大优于以前的工作，同时分析实验结果表明建议方法不仅捕捉标签之间的相关性，而且在预测不同标签时自动选择最有信息的词。

Abstract

multi-label classification is an important yet challenging task in natural language processing. It is more complex than single-label classification in that the labels tend to be correlated. Existing methods tend to ignore the →

multi-label classification natural language processing sequence generation decoder structure correlations

发现论文，激发创造

一种深度强化序列到集合模型用于多标签文本分类

本文提出了一种利用深度强化学习的新型序列到集合框架，不仅可以捕捉标签之间的关联性，而且还可以减少对标签顺序的依赖，实验结果表明我们提出的方法明显优于竞争基线。

Sep, 2018

基于半监督多任务学习的序列标注

本文提出了一种序列标注框架，采用辅助训练目标，并通过学习预测数据集中每个词周围的单词进行语言建模，以此学习通用的语义和语法组合模式，并在不需要额外标注或未标注数据的情况下，实现在多个序列标注任务上取得一致的性能提升。

Apr, 2017

多标签文档分类的统计主题模型

本文探讨生成性统计主题模型在多标签文档分类中的应用，相对于判别性模型，在包含大量稀有标签和高度倾斜标签分布等实际数据集的分类问题中有优越性。实验结果表明，相较于判别性方法，概率生成模型在多标签分类方面表现优异。

Jul, 2011

用于稳健结构预测的结构化语言生成模型

我们提出了结构化语言生成模型（SLGM），这是一种结合新的损失函数和推理方法，以更好地泛化结构化输出的混合模型。

Feb, 2024

增强式自然语言用于生成式序列标记

该研究提出了一种生成式框架，用于多个序列标记任务和句子级分类。与以往的判别式方法不同，该模型通过共享自然语言输出空间，自然地融合标签语义，并在任务之间共享知识。该框架具有通用性，可在 few-shot、低资源和高资源任务上表现良好，并在命名实体识别、槽位标记和意图分类等基准测试中展示了这些优势。

Sep, 2020

一种用于预测集合值输出的顺序集合生成方法

本文提出了一种新的机器学习框架 —— 顺序集合生成 (SSG)，可以处理标签和序列输出集。通过采用适当正则化和循环生成新标签或序列以生成完整集合，SSG 在性质上顺序不敏感且适用于各种集合输出问题，如分类标签或序列。实验结果表明，SSG 对于基准方法具有良好的性能。

Mar, 2019

面向多标签文本分类的标签依赖感知集预测网络

通过构建邻接矩阵及应用 GCN 模型对标签进行建模，从而解决多标签文本分类中标签的序列乱序问题，并利用集合预测网络同时使用句子信息和标签信息进行分类。此外，使用巴氏距离对输出概率分布进行约束，提高了召回能力。实验证明，该方法在多个数据集上表现优异，胜过之前的方法。

Apr, 2023

文本分类任务的深度序列模型

本文研究大数据领域，探讨了自然语言处理、文本分类和序列模型的应用，结果显示序列模型在二分类和多分类上取得了优异的成果，但机器仍需进一步改进以达到人类水平。

Jul, 2022

无序学习：减轻多标记分类中的曝光偏差

本文提出了一种新的多标签分类框架，不依赖于预定义的标签顺序，有效减轻暴露偏差，通过实验结果表明，相较于竞争基线模型，该方法具有很大的优势和更好的泛化能力，可生成更好的未训练标签组合。

Sep, 2019

利用多任务学习增强多标签文本分类中的标签相关反馈

通过引入多任务学习和标签相关性反馈机制来增强标签相关性学习，其中采用文档 - 标签交叉注意力机制来生成一个更具有区分度的文档表示，以及两个辅助标签共现预测任务来增强标签相关性学习，实验结果表明，我们的方法在 AAPD 和 RCV1-V2 数据集上优于竞争性基线方法。

Jun, 2021