本研究利用实例级域相关特征和自动构建培训计划的方式,同时为多领域进行数据选择;经过大规模实验,证明多领域计划能达到或超过单独培训的性能,并带来实质收益。
Aug, 2019
本文提出了一种新的元课程学习方法,通过先学习相似领域的课程以避免早期陷入糟糕的局部最优,然后学习各自的课程以提高模型鲁棒性从而改善低资源神经机器翻译领域自适应问题。实验结果表明,这种方法可以提高熟悉和不熟悉领域的翻译性能。
Mar, 2021
本文全面调查总结了当前最先进的神经机器翻译领域适应技术,旨在解决场景中特定领域缺乏相应语料库而导致自然语言翻译效果下降的问题。
Jun, 2018
采用概率课程学习方法,可以在不损失翻译质量的前提下,缩短德语 - 英语翻译模型的收敛时间,但具体效果受到样本难度标准、课程表和超参数的影响。
Nov, 2018
本文介绍了『Domain Differential Adaptation(DDA)』的框架,该框架通过使用相关任务中的模型直接建模不同领域之间的差异,从而成功地应用于神经机器翻译的领域自适应中,并在多个实验设置中实现比其他替代方法更好的改进效果。
Oct, 2019
神经机器翻译模型在新领域上的性能仍然较差,本研究提出了一种名为 Epi-Curriculum 的新方法来解决低资源域适应问题,该方法结合了新的经验教学框架和去噪课程学习,通过使编码器 / 解码器与经验不足的解码器 / 编码器进行经验性训练,增强了模型对领域转移的鲁棒性,去噪课程学习则通过逐渐引导学习过程从简单到更困难的任务,进一步提高了模型的适应性。实验结果表明 Epi-Curriculum 提高了模型在可见和不可见领域的鲁棒性和适应性,我们的经验性训练框架增强了编码器和解码器对领域转移的鲁棒性。
Sep, 2023
本文提出了一种简单的领域自适应方法,可以应用于使用交叉熵损失训练的神经网络,在字幕数据集上展示了该方法相对于其他领域自适应方法的表现提高。
Jul, 2016
本文提出了一种在机器翻译中称之为 “专业化” 的领域适应方法,对该方法进行了探索,并发现其在学习速度和适应精度方面的结果表现出色。该方法尤其适用于计算机辅助翻译(CAT)中的人类后期编辑工作流程,特别是在术语、领域和风格适应方面。
Dec, 2016
提出一种通过使用语言建模来学习领域感知特征嵌入,在多个实验中提高神经机器翻译性能的方法,该方法允许使用者指定特定领域的文本表示。
本文针对神经机器翻译中的无监督领域自适应问题,提出一种跨语料库数据选择方法,通过对多语言 BERT 进行对比学习,实现源语言和目标语言之间的表示对齐,从而实现零样本领域分类器的可转移性,并且通过联合学习翻译任务和领域区分任务来适应新领域。我们在五个不同的领域和三种语言对的神经机器翻译上进行了跨语料库数据选择方法的评估,并在 COVID-19 疫情实时翻译中进行了应用验证, 实验结果表明,我们提出的方法相对于基线方法的 BLEU 指标得分提高了 1.5 个百分点。
Sep, 2021