神经机器翻译中领域自适应的课程学习

May, 2019

神经机器翻译中领域自适应的课程学习

Curriculum Learning for Domain Adaptation in Neural Machine Translation

Xuan Zhang, Pamela Shapiro, Gaurav Kumar, Paul McNamee, Marine Carpuat...

TL;DR介绍了一种课程学习方法，将通用的神经机器翻译模型适应于特定领域，实验结果表明，在两个领域和两种语言对中，该方法始终优于基准模型。

Abstract

We introduce a curriculum learning approach to adapt generic neural machine translation models to a specific domain. Samples are grouped by their similarities to the domain of interest and each group is fed to th

curriculum learning neural machine translation specific domain training algorithm language pairs

发现论文，激发创造

神经机器翻译多域课程学习

本研究利用实例级域相关特征和自动构建培训计划的方式，同时为多领域进行数据选择；经过大规模实验，证明多领域计划能达到或超过单独培训的性能，并带来实质收益。

Aug, 2019

神经机器翻译领域适应的元课程学习

本文提出了一种新的元课程学习方法，通过先学习相似领域的课程以避免早期陷入糟糕的局部最优，然后学习各自的课程以提高模型鲁棒性从而改善低资源神经机器翻译领域自适应问题。实验结果表明，这种方法可以提高熟悉和不熟悉领域的翻译性能。

Mar, 2021

神经机器翻译的领域自适应调查

本文全面调查总结了当前最先进的神经机器翻译领域适应技术，旨在解决场景中特定领域缺乏相应语料库而导致自然语言翻译效果下降的问题。

Jun, 2018

神经机器翻译中课程学习的实证探索

采用概率课程学习方法，可以在不损失翻译质量的前提下，缩短德语 - 英语翻译模型的收敛时间，但具体效果受到样本难度标准、课程表和超参数的影响。

Nov, 2018

神经机器翻译的领域差异适应

本文介绍了『Domain Differential Adaptation（DDA）』的框架，该框架通过使用相关任务中的模型直接建模不同领域之间的差异，从而成功地应用于神经机器翻译的领域自适应中，并在多个实验设置中实现比其他替代方法更好的改进效果。

Oct, 2019

Epi-Curriculum: 短期课程学习低资源领域调适在神经网络机器翻译中

神经机器翻译模型在新领域上的性能仍然较差，本研究提出了一种名为 Epi-Curriculum 的新方法来解决低资源域适应问题，该方法结合了新的经验教学框架和去噪课程学习，通过使编码器 / 解码器与经验不足的解码器 / 编码器进行经验性训练，增强了模型对领域转移的鲁棒性，去噪课程学习则通过逐渐引导学习过程从简单到更困难的任务，进一步提高了模型的适应性。实验结果表明 Epi-Curriculum 提高了模型在可见和不可见领域的鲁棒性和适应性，我们的经验性训练框架增强了编码器和解码器对领域转移的鲁棒性。

Sep, 2023

参数增强的神经网络域适应

本文提出了一种简单的领域自适应方法，可以应用于使用交叉熵损失训练的神经网络，在字幕数据集上展示了该方法相对于其他领域自适应方法的表现提高。

Jul, 2016

领域专门化：神经机器翻译的后训练领域适应

本文提出了一种在机器翻译中称之为 “专业化” 的领域适应方法，对该方法进行了探索，并发现其在学习速度和适应精度方面的结果表现出色。该方法尤其适用于计算机辅助翻译（CAT）中的人类后期编辑工作流程，特别是在术语、领域和风格适应方面。

Dec, 2016

面向神经机器翻译的无监督领域自适应与领域感知特征嵌入

提出一种通过使用语言建模来学习领域感知特征嵌入，在多个实验中提高神经机器翻译性能的方法，该方法允许使用者指定特定领域的文本表示。

Aug, 2019

基于多语数据选择的神经机器翻译领域通用无监督适应

本文针对神经机器翻译中的无监督领域自适应问题，提出一种跨语料库数据选择方法，通过对多语言 BERT 进行对比学习，实现源语言和目标语言之间的表示对齐，从而实现零样本领域分类器的可转移性，并且通过联合学习翻译任务和领域区分任务来适应新领域。我们在五个不同的领域和三种语言对的神经机器翻译上进行了跨语料库数据选择方法的评估，并在 COVID-19 疫情实时翻译中进行了应用验证，实验结果表明，我们提出的方法相对于基线方法的 BLEU 指标得分提高了 1.5 个百分点。

Sep, 2021