通过对多个领域进行翻译的唯一神经网络在运行时进行的域控制技术,生成的神经机器翻译模型不需要针对每个领域重新估算模型参数,为真实使用场景提供了一种有效的方法,且无论是针对任何一个领域还是针对未知域的数据翻译,本文所提出的新技术都显示了质量的提高。
Dec, 2016
本文介绍了一种适应新领域的神经机器翻译(NMT)系统,并展示了在两种语言对上,适应方法相比于常用方法在自动和人工评估测量标准下的显著性提升,而一般领域性能仅略有下降,适应过程快速且不需要重新训练NMT模型。
本文提出了一种新颖的领域自适应方法——“混合微调”,用于神经机器翻译。该方法将微调和多领域 NMT 两种现有方法相结合,并在一个混合了内外领域语料库的平行语料库上对NMT模型进行微调,然后通过增加人工标记来指示特定领域对所有语料库进行增强。我们在实证基础上比较了我们的方法与微调和多领域方法,讨论了它的优点和缺点。
Jan, 2017
本文全面调查总结了当前最先进的神经机器翻译领域适应技术,旨在解决场景中特定领域缺乏相应语料库而导致自然语言翻译效果下降的问题。
Jun, 2018
提出一种通过使用语言建模来学习领域感知特征嵌入,在多个实验中提高神经机器翻译性能的方法,该方法允许使用者指定特定领域的文本表示。
Aug, 2019
本文介绍了『Domain Differential Adaptation(DDA)』的框架,该框架通过使用相关任务中的模型直接建模不同领域之间的差异,从而成功地应用于神经机器翻译的领域自适应中,并在多个实验设置中实现比其他替代方法更好的改进效果。
Oct, 2019
本文提出一种双重迭代领域自适应框架,通过多层反向翻译知识传输来提高公共领域的翻译知识的提取效果,并通过将这种转移策略应用于多个不同相似度的领域进行了验证。该框架在中英文和英德文翻译任务中取得了令人满意的实验结果。
Dec, 2019
该研究介绍了一种基于神经机器翻译的重要性修剪方法,通过知识蒸馏和参数细调,解决了域自适应中的遗忘、差异和模型爆炸等问题,从而达到了在通用域和特定域翻译中都取得显著提高的目的。
Mar, 2021
本研究探讨了针对预训练第三方 NMT 模型的单语和平行数据方法在领域适应中的效果,在低资源条件下提出了集成方法来缓解翻译质量的降低,并给出了在三个领域和四个语言对中的建议。
Jun, 2022
本研究解决了低资源语言机器翻译中因依赖大量平行语料而造成的进展限制问题。通过细化领域相关数据,本文提出了一种创新方法,在零样本场景下识别可迁移领域,并评估语言特定与领域特定因素对适应有效性的影响。研究表明,在医学、法律和信息技术等专业领域,明确定义的领域数据显著提升了翻译质量,强调了其在领域迁移学习中的重要性。
Aug, 2024