SGM: 多标记分类的序列生成模型
本文提出了一种利用深度强化学习的新型序列到集合框架,不仅可以捕捉标签之间的关联性,而且还可以减少对标签顺序的依赖,实验结果表明我们提出的方法明显优于竞争基线。
Sep, 2018
本文提出了一种序列标注框架,采用辅助训练目标,并通过学习预测数据集中每个词周围的单词进行语言建模,以此学习通用的语义和语法组合模式,并在不需要额外标注或未标注数据的情况下,实现在多个序列标注任务上取得一致的性能提升。
Apr, 2017
本文探讨生成性统计主题模型在多标签文档分类中的应用,相对于判别性模型,在包含大量稀有标签和高度倾斜标签分布等实际数据集的分类问题中有优越性。实验结果表明,相较于判别性方法,概率生成模型在多标签分类方面表现优异。
Jul, 2011
该研究提出了一种生成式框架,用于多个序列标记任务和句子级分类。与以往的判别式方法不同,该模型通过共享自然语言输出空间,自然地融合标签语义,并在任务之间共享知识。该框架具有通用性,可在 few-shot、低资源和高资源任务上表现良好,并在命名实体识别、槽位标记和意图分类等基准测试中展示了这些优势。
Sep, 2020
本文提出了一种新的机器学习框架 —— 顺序集合生成 (SSG),可以处理标签和序列输出集。通过采用适当正则化和循环生成新标签或序列以生成完整集合,SSG 在性质上顺序不敏感且适用于各种集合输出问题,如分类标签或序列。实验结果表明,SSG 对于基准方法具有良好的性能。
Mar, 2019
通过构建邻接矩阵及应用 GCN 模型对标签进行建模,从而解决多标签文本分类中标签的序列乱序问题,并利用集合预测网络同时使用句子信息和标签信息进行分类。此外,使用巴氏距离对输出概率分布进行约束,提高了召回能力。实验证明,该方法在多个数据集上表现优异,胜过之前的方法。
Apr, 2023
本文提出了一种新的多标签分类框架,不依赖于预定义的标签顺序,有效减轻暴露偏差,通过实验结果表明,相较于竞争基线模型,该方法具有很大的优势和更好的泛化能力,可生成更好的未训练标签组合。
Sep, 2019
通过引入多任务学习和标签相关性反馈机制来增强标签相关性学习,其中采用文档 - 标签交叉注意力机制来生成一个更具有区分度的文档表示,以及两个辅助标签共现预测任务来增强标签相关性学习,实验结果表明,我们的方法在 AAPD 和 RCV1-V2 数据集上优于竞争性基线方法。
Jun, 2021