将 RNN 序列预测模型应用于多标签集合预测

ACLApr, 2019

将 RNN 序列预测模型应用于多标签集合预测

Adapting RNN Sequence Prediction Model to Multi-label Set Prediction

Kechen Qin, Cheng Li, Virgil Pavlu, Javed A. Aslam

TL;DR本篇论文提出了一种适用于基于文本的多标签分类的 RNN 序列模型适应方法；其提出了一种基于一种原则的 “集合概率” 表示方法，在此基础上提供了新的训练目标和预测目标进行标签集的概率计算和预测，并且该方法在实验中优于当今的最优方法。

Abstract

We present an adaptation of rnn sequence models to the problem of multi-label classification for text, where the target is a set of labels, not a sequence. Previous such RNN models define probabilities for sequences but not for sets; attempts to obtain a →

rnn sequence models multi-label classification set probability training objective prediction objective

发现论文，激发创造

面向多标签文本分类的标签依赖感知集预测网络

通过构建邻接矩阵及应用 GCN 模型对标签进行建模，从而解决多标签文本分类中标签的序列乱序问题，并利用集合预测网络同时使用句子信息和标签信息进行分类。此外，使用巴氏距离对输出概率分布进行约束，提高了召回能力。实验证明，该方法在多个数据集上表现优异，胜过之前的方法。

Apr, 2023

多标签分类的无序循环模型

本文提出一种动态排序正解标签的方法，用于多标签分类任务，以加快更优 LSTM 模型的训练。实验证明，该方法避免了生成重复标签，并超过了其他 CNN-RNN 模型的性能，证明了在挑战性的数据集上使用标准结构的图像编码器和语言解码器采用提出的损失函数可以得到最先进的结果。

Nov, 2019

基于视觉注意力的无序 RNN 多标签分类

本文提出了用于多标签分类的联合学习注意力和循环神经网络模型，可有效利用注意力和 LSTM 模型，并且扩展了 beam 搜索技术以提高效率。

Jul, 2017

一种深度强化序列到集合模型用于多标签文本分类

本文提出了一种利用深度强化学习的新型序列到集合框架，不仅可以捕捉标签之间的关联性，而且还可以减少对标签顺序的依赖，实验结果表明我们提出的方法明显优于竞争基线。

Sep, 2018

SGM: 多标记分类的序列生成模型

本文提出将多标签分类任务视为序列生成问题，并应用具有新型解码器结构的序列生成模型来解决这个任务，实验结果表明我们的建议方法大大优于以前的工作，同时分析实验结果表明建议方法不仅捕捉标签之间的相关性，而且在预测不同标签时自动选择最有信息的词。

Jun, 2018

无序学习：减轻多标记分类中的曝光偏差

本文提出了一种新的多标签分类框架，不依赖于预定义的标签顺序，有效减轻暴露偏差，通过实验结果表明，相较于竞争基线模型，该方法具有很大的优势和更好的泛化能力，可生成更好的未训练标签组合。

Sep, 2019

基于 RNN 的结构化预测模型在临床文本序列标注中的应用

在临床领域中，序列标注是一种广泛使用的方法，其主要应用是从非结构化的自然语言数据中提取药物、指示和副作用等医学实体。本文通过使用具有循环神经网络的多种基于 CRF 的结构化学习模型，扩展了先前研究的 LSTM-CRF 模型，并提出了一种具有 RNN 位势的跳链 CRF 推理的近似版本，以实现各种医学实体的精确短语检测。

Aug, 2016

基于半监督多任务学习的序列标注

本文提出了一种序列标注框架，采用辅助训练目标，并通过学习预测数据集中每个词周围的单词进行语言建模，以此学习通用的语义和语法组合模式，并在不需要额外标注或未标注数据的情况下，实现在多个序列标注任务上取得一致的性能提升。

Apr, 2017

循环神经网络中的序列预测计划抽样

本文提出课程学习策略，用于训练循环神经网络，以尽量减小实际工作场景中训练和推理之间的差异，如在 MSCOCO 图片注释挑战赛中实测有效。

Jun, 2015

通过混合目标函数重新审视 LSTM 网络，用于半监督文本分类

本文研究双向 LSTM 网络在文本分类任务中的监督和半监督学习方法，利用交叉熵损失以及熵最小化、对抗和虚拟对抗损失相结合的训练策略，在多个基准数据集上取得了最新的文本分类结果。

Sep, 2020