将 RNN 序列预测模型应用于多标签集合预测
通过构建邻接矩阵及应用 GCN 模型对标签进行建模,从而解决多标签文本分类中标签的序列乱序问题,并利用集合预测网络同时使用句子信息和标签信息进行分类。此外,使用巴氏距离对输出概率分布进行约束,提高了召回能力。实验证明,该方法在多个数据集上表现优异,胜过之前的方法。
Apr, 2023
本文提出一种动态排序正解标签的方法,用于多标签分类任务,以加快更优 LSTM 模型的训练。实验证明,该方法避免了生成重复标签,并超过了其他 CNN-RNN 模型的性能,证明了在挑战性的数据集上使用标准结构的图像编码器和语言解码器采用提出的损失函数可以得到最先进的结果。
Nov, 2019
本文提出了一种利用深度强化学习的新型序列到集合框架,不仅可以捕捉标签之间的关联性,而且还可以减少对标签顺序的依赖,实验结果表明我们提出的方法明显优于竞争基线。
Sep, 2018
本文提出将多标签分类任务视为序列生成问题,并应用具有新型解码器结构的序列生成模型来解决这个任务,实验结果表明我们的建议方法大大优于以前的工作,同时分析实验结果表明建议方法不仅捕捉标签之间的相关性,而且在预测不同标签时自动选择最有信息的词。
Jun, 2018
本文提出了一种新的多标签分类框架,不依赖于预定义的标签顺序,有效减轻暴露偏差,通过实验结果表明,相较于竞争基线模型,该方法具有很大的优势和更好的泛化能力,可生成更好的未训练标签组合。
Sep, 2019
在临床领域中,序列标注是一种广泛使用的方法,其主要应用是从非结构化的自然语言数据中提取药物、指示和副作用等医学实体。本文通过使用具有循环神经网络的多种基于 CRF 的结构化学习模型,扩展了先前研究的 LSTM-CRF 模型,并提出了一种具有 RNN 位势的跳链 CRF 推理的近似版本,以实现各种医学实体的精确短语检测。
Aug, 2016
本文提出了一种序列标注框架,采用辅助训练目标,并通过学习预测数据集中每个词周围的单词进行语言建模,以此学习通用的语义和语法组合模式,并在不需要额外标注或未标注数据的情况下,实现在多个序列标注任务上取得一致的性能提升。
Apr, 2017
本文研究双向 LSTM 网络在文本分类任务中的监督和半监督学习方法,利用交叉熵损失以及熵最小化、对抗和虚拟对抗损失相结合的训练策略,在多个基准数据集上取得了最新的文本分类结果。
Sep, 2020