预训练神经机器翻译模型的强化课程学习

AAAIApr, 2020

预训练神经机器翻译模型的强化课程学习

Reinforced Curriculum Learning on Pre-trained Neural Machine Translation Models

Mingjun Zhao, Haijiang Wu, Di Niu, Xiaoli Wang

TL;DR本文针对神经机器翻译中如何最佳利用具有多样性质和不同质量级别的数据样本提出了数据选择框架，通过筛选对模型性能有重要影响的样本来改进已经预先训练过的模型。实验表明，所提出的基于确定性演员 - 评论家 (Deterministic Actor-Critic) 的数据选择方法能够在不增加新的训练数据的情况下显著提高翻译质量，并大幅优于其他强基线方法。

Abstract

The competitive performance of neural machine translation (NMT) critically relies on large amounts of training data. However, acquiring high-quality translation pairs requires expert knowledge and is costly. Therefore, how to best utilize a given dataset of samples with diverse quality

neural machine translation curriculum learning pre-training reinforcement learning data selection

发现论文，激发创造

基于强化学习的神经机器翻译课程优化

本研究运用强化学习方法，实现神经机器翻译中异质训练数据的有效生成和利用，提出课程学习框架，相比于传统方法，该方法展现出更好的表现和更强的数据泛化能力。

Feb, 2019

神经机器翻译数据选择课程

本文通过两阶段课程训练框架及对六种语言对的全面实验，证明了基于预训练方法和在线评分的确定性评分选择数据子集，对神经机器翻译模型进行微调训练的课程训练策略会显著提高 BLEU 质量（高达 2.2 个 BLEU），并且更快地收敛（更新次数减少了约 50%）。

Mar, 2022

基于能力的神经机器翻译课程学习

本文提出了一种基于课程学习的神经机器翻译框架，通过对训练样本进行过滤，提高模型训练效率和性能。该方法不仅可以减少训练时间和需要调整的超参数数量，还可以防止模型陷入局部最优解，从而获得更好的性能表现。实验结果表明，该方法可以在保证翻译质量的同时减少训练时间达 70%。

Mar, 2019

神经机器翻译中课程学习的实证探索

采用概率课程学习方法，可以在不损失翻译质量的前提下，缩短德语 - 英语翻译模型的收敛时间，但具体效果受到样本难度标准、课程表和超参数的影响。

Nov, 2018

低资源神经机器翻译的动态课程学习

本研究提出一种动态课程学习方法，通过衡量模型的收益和能力来调整训练样本的顺序，从而使训练低资源神经机器翻译模型更加高效。在 Transformer-based 系统上的实验结果表明，该方法优于几个强基线，并适用于不同大小的 low-resource 机器翻译基准。

Nov, 2020

神经机器翻译的自适应学习

本研究提出自适应学习方法来改进神经机器翻译 (NMT) 训练过程，允许 NMT 模型自动评估对训练示例的学习自信度并通过调节每次迭代的损失来灵活地控制学习，实验证明该方法在提高翻译质量和加速收敛速度方面优于强基线和人工设计课程训练的模型。

Oct, 2020

基于范数的课程式学习在神经机器翻译中的应用

本文介绍了一种新的基于范数（即长度或模块）的课程学习方法，利用词嵌入的范数作为句子难度、模型能力和句子权重的度量，以提高神经机器翻译（NMT）的训练效率，并在 WMT'14 英德和 WMT'17 中英翻译任务中证明其优越性。

Jun, 2020

神经机器翻译的强化学习研究

本文进行了一项系统性研究，比较了训练 NMT 模型的几个重要因素（例如基线奖励，奖励塑造）在强化学习中的作用，并提出了一种新的方法来利用强化学习进一步提高用单语数据训练的 NMT 系统的性能，融合了所有发现，取得了 WMT17 中英翻译任务的最高性能。

Aug, 2018

神经机器翻译多域课程学习

本研究利用实例级域相关特征和自动构建培训计划的方式，同时为多领域进行数据选择；经过大规模实验，证明多领域计划能达到或超过单独培训的性能，并带来实质收益。

Aug, 2019

自监督神经机器翻译中的自主课程学习

该研究提供了有关 SSNMT 模型在训练期间进行采样选择的深入分析，证明了该模型能够自我选择越来越复杂和相关任务的样本，并执行去噪曲线，以提高提取和翻译性能。其中，相互监督信号的动态对提取和翻译性能至关重要。研究显示，使用 Gunning-Fog 可读性指数时，SSNMT 从适合高中学生的 Wikipedia 数据开始提取和学习，并迅速转向适合大一学生的内容。

Apr, 2020