使用多个子词候选项改进神经网络翻译模型的子词正则化
该研究通过提出对抗子单词规范化技术(ADVSR)探讨了在训练过程中是否可以使用梯度信号作为多样化子单词分割的替代标准,实验证明该技术可以有效地减少分割错误对神经机器翻译模型的影响,从而提高模型在低资源和外部数据集上的性能。
Apr, 2020
探讨使用多个子词部分划分提高神经机器翻译模型的鲁棒性,提出了一个推理策略,通过多种划分途径,包括最可信的划分和多个样本划分,来逼近边缘分布,并进行预测聚合,将其视为单个模型集成,在低资源机器翻译任务中改善了基于子词规则化训练的模型的性能。
Mar, 2022
该研究提出了一种称为子词分节机器翻译(SSMT)的新方法,通过在单个可训练模型中联合学习目标句子单词的分割和目标句子生成,在生成翻译过程中采用动态解码算法进行细分操作,实验结果表明,SSMT 能提高粘着语言的 chrF 分数以及对于评估形态组成通用性构建的测试集的鲁棒性也更强。
May, 2023
应用现有子词规范化方法 (Kudo,2018;Profilkov et al., 2020) 对预训练的多语言表示进行微调,通过多视角子词规范化(MVR)方法增强跨语言转移的有效性,同时改善标准分词算法的效果,提高多语种基准测试 (XTREME) 的一致性改进 2.5 个点。
Mar, 2021
该研究提出了一种基于语言模型的子词分段语言模型(SSLM),在训练期间学习如何分段单词,以优化语言模型的性能。通过统一子词分割和语言建模,SSL 模型学习到优化语言建模性能的子词。结果表明,学习子词分割是现有子词分割器的有效替代方案,可以发现类似词素的子词,以提高其语言模型的能力。
Oct, 2022
本文提出一种自动调节神经机器翻译中分词粒度的方法,可以在训练的同时引入新的词汇并优化语言分割,最终达到与最优表现相似的结果,并在训练效率和罕见词汇的表现方面带来了改进。
Oct, 2018
此研究探讨了子词切分在跨语言迁移中的作用,发现子词规范化提高了多语言建模的协同效应,而 BPE 在跨语言微调中更有效地促进了迁移,在子词建模方面的决策对于优化多语言建模的好处至关重要。
Mar, 2024
本文提出将字节对编码(Byte Pair Encoding)引入到通用无监督框架中以解决翻译任务中由于罕见或未知单词对翻译效果的限制,经实验验证在德英和中英翻译任务中,使用 accessor variety 和 description length gain 进行优化能在不同程度上优于基线频率加权方案。
Jul, 2018