提出了一种新的学习方式:从头开始进行领域自适应,以便在隐私保护的情况下将 NLP 扩展到敏感领域。研究比较了几种方法,包括数据选择和领域自适应算法以及主动学习方法,在情感分析和命名实体识别等两个 NLP 任务上进行了验证,结果表明结合上述方法可以缓解领域差距并进一步提高结果。
Sep, 2022
本篇综述针对最近的研究进展,对不需要标记目标领域数据的神经无监督领域自适应技术进行了概述,包括从传统非神经方法到预训练模型迁移的方法,并揭示了自然语言处理任务类型中存在的偏见问题以及未来的研究方向,特别是面向 NLP 的超分布通用化需求。
May, 2020
本文提出了一种简单的领域自适应方法,可以应用于使用交叉熵损失训练的神经网络,在字幕数据集上展示了该方法相对于其他领域自适应方法的表现提高。
Jul, 2016
本研究提出了一种针对领域自适应问题的新型表示学习算法,其中训练和测试数据来自类似但不同的分布,实验结果表明,我们的神经网络算法对领域适应具有更好的性能表现,而不管是标准神经网络还是支持向量机,即使是使用 Chen 等人提出的最先进的边缘化堆栈去噪自编码器的输入特征提取。
Dec, 2014
本研究提供了一种训练多领域、基于递归神经网络的语言生成器的程序,包含了多个适应步骤,并利用伪造数据和领域内句子的优化目标函数,旨在在新的、看不见的领域内显著减少培训的数据需求,其语料库评估结果和主观测试都表示该程序可以在保证 BLEU 分数和槽误差率竞争力的同时大幅提高语言生成器性能。
Mar, 2016
通过引入多个特定于源域的分类器,利用预测目标样本属于每个源域的概率进行最优融合,并引入一个域不可知组件来支持最终分类器,我们的深度学习模型在两个公共基准测试上表现出很强的泛化能力。
Jun, 2018
本文研究深度学习中前馈源自适应的应用及其改进,通过交叉关注机制自适应目标数据集,探索自动化实例选取提升性能,实验表明我们提出的框架能显著改进现有方法。
Jul, 2022
本论文提出了一种新的多源域自适应的一般化界限,并使用对抗神经网络学习特征表示,取得了在情感分析、数字分类和车辆计数等数据集上显著的适应性表现。
May, 2017
该论文提出一种学会学习的方法,通过学习辅助损失本身来提高模型的泛化能力,进而应用于领域推广的问题,包括传统领域推广和异构域推广。实验结果表明,该方法在两种情况下优于现有的解决方案。
Jan, 2019
该研究对带有多个数据来源的领域转移进行了详尽的调查,发现了一些有效的方法并提出了一种新的有效方法 DAL-E,并探讨了选定的示例和域具有的特性。
Feb, 2022