多领域文本分类的随机对抗网络
本文提出了一个基于对抗学习的多任务学习框架,在16个文本分类任务上的实验结果表明了该方法的优势,并证明了模型学习到的共享知识可以作为现成的知识轻松迁移到新的任务中。
Apr, 2017
本文提出一种多项式对抗网络(MAN)用于处理多域文本分类问题(MDTC), MAN学习在多个域上保持不变的特征,并通过减少每个域特征分布之间的差异来实现。MAN在实验中取得了显著的性能提升,并且在无标签数据的域中达到了最先进的性能水平。
Feb, 2018
该研究提出了一种基于潜变量模型的多领域学习系统方法,可用于提取重要的领域信号,并在对抗性学习等方法中,相对于其他对比基准领域适应方法,显著提升了性能。
Jun, 2019
本文提出了一种新颖的双对抗协同学习方法,用于多领域文本分类,该方法利用共享-私有网络进行特征提取,并在不同域和标签与未标签数据同时下采用双重对抗正则化来对齐特征,并旨在通过所学习的特征来提高分类器的泛化能力。我们在多领域情感分类数据集上进行了实验,结果表明所提出的方法达到了目前最先进的多领域文本分类性能。
Sep, 2019
本研究提出了一个名为MRAN的混合正则化对抗网络,通过引入领域和类别的混合正则化来增强共享潜在空间内在特征,并在训练实例之间强制执行一致的预测,以使学习到的特征更具领域内部不变性和区分性,实验结果表明对于Amazon评论数据集和FDU-MTL数据集分别获得了87.64%和89.0%的平均准确率,优于所有相关基线模型。
Jan, 2021
本文提出了条件对抗网络 (CANs) 框架,旨在探索共享特征和标签预测之间的关系,以对共享特征施加更多的可辨识性,用于多领域文本分类 (MDTC)。CAN引入了一个条件域鉴别器,同时对共享特征表示和类别感知信息建模,采用熵条件保证共享特征的可转移性。我们提供了CAN框架的理论分析,证明CAN的目标等价于最小化共享特征和标签预测的多个联合分布之间的总发散。因此,CAN是一个理论上良好的对抗网络,其可以判别多个分布。在两个MDTC基准测试上的评估结果表明,CAN优于之前的方法。进一步的实验表明,CAN具有将学习到的知识推广到未见领域的良好能力。
Feb, 2021
本文提出了一种基于共正则化的对抗学习机制,用于多领域文本分类,通过构建两个不同的共享潜在空间,在其中进行每个domain的域对齐,并通过惩罚两个对齐在未标记数据上的预测不一致性来进行特征学习。同时,此方法还结合了虚拟对抗训练进行一致性正则化。实验表明该模型在两个MDTC基准测试上优于现有方法。
Jan, 2022
本文提出了一种基于关键词权重排序的课程学习策略来改善多域文本分类模型的性能,该方法在对抗训练的基础上,并且在Amazon评论和FDU-MTL数据集上的实验结果表明,它能有效地提高多领域文本分类模型的性能,并优于现有的方法。
Oct, 2022
我们提出了一种称为正则化条件对齐 (RCA) 的方法,通过对领域和类别的联合分布进行对齐,来匹配相同类别中的特征并增强获取的特征的判别能力,同时还利用熵最小化和虚拟对抗训练来限制未标记数据的预测不确定性并增强模型的鲁棒性。在两个基准数据集上的实证结果表明,我们的RCA方法优于最先进的多领域文本分类技术。
Dec, 2023
多领域文本分类(MDTC)是利用相关领域的可用资源来提高目标领域的分类准确性。本研究提供了关于MDTC的理论分析,将其分解为多个领域适应任务,并以边缘差异作为领域差异的度量,建立了一个基于Rademacher复杂度的新的泛化界限,并提出了基于边缘差异的对抗训练(MDAT)方法以验证其有效性。实验证明,我们的MDAT方法在两个MDTC基准上超过了先前的方法。
Mar, 2024