多视角次词正则化

ACLMar, 2021

Multi-view Subword Regularization

Xinyi Wang, Sebastian Ruder, Graham Neubig

TL;DR应用现有子词规范化方法 (Kudo,2018;Profilkov et al., 2020) 对预训练的多语言表示进行微调，通过多视角子词规范化（MVR）方法增强跨语言转移的有效性，同时改善标准分词算法的效果，提高多语种基准测试 (XTREME) 的一致性改进 2.5 个点。

Abstract

multilingual pretrained representations generally rely on subword segmentation algorithms to create a shared multilingual vocabulary. However, standard heuristic algorithms often lead to sub-optimal segmentation, especially for languages with limited amounts of data. In this paper, we

multilingual pretrained representations subword regularization methods fine-tuning mvr cross-lingual transfer

发现论文，激发创造

面向强鲁棒性神经机器翻译的对抗子词规范化

该研究通过提出对抗子单词规范化技术（ADVSR）探讨了在训练过程中是否可以使用梯度信号作为多样化子单词分割的替代标准，实验证明该技术可以有效地减少分割错误对神经机器翻译模型的影响，从而提高模型在低资源和外部数据集上的性能。

Apr, 2020

使用多个子词候选项改进神经网络翻译模型的子词正则化

介绍了一种利用 subword segmentation 的噪声来提高神经机器翻译鲁棒性的正则化方法，主要应用于低资源领域。

Apr, 2018

低资源机器翻译中基于子词正则化的单模型集成

探讨使用多个子词部分划分提高神经机器翻译模型的鲁棒性，提出了一个推理策略，通过多种划分途径，包括最可信的划分和多个样本划分，来逼近边缘分布，并进行预测聚合，将其视为单个模型集成，在低资源机器翻译任务中改善了基于子词规则化训练的模型的性能。

Mar, 2022

多语言翻译中的子词和跨语言转移的系统分析

此研究探讨了子词切分在跨语言迁移中的作用，发现子词规范化提高了多语言建模的协同效应，而 BPE 在跨语言微调中更有效地促进了迁移，在子词建模方面的决策对于优化多语言建模的好处至关重要。

Mar, 2024

MvSR-NAT：用于非自回归机器翻译的多视角子集正则化

介绍了一种名为 Multi-view Subset Regularization (MvSR) 的新型规则化方法，通过保持模型的一致性和鼓励预测共享掩码位置来改善条件蒙面语言模型（CMLM）的表现，在三个公共基准测试中获得了显着的 BLEU 得分

Aug, 2021

跨语言一致性正则化学习多语句子表示

MuSR 是一种支持 220 多种语言的全能多语种句子表示模型，通过使用数十亿个英文为中心的平行语料库，采用使用跨语言一致性规则化技术的多语言 NMT 框架，以训练多语言 Transformer 编码器，并采用辅助 Transformer 解码器，实现了多语言相似性搜索和双文本挖掘任务，表现优于由 148 个独立的多语种句子编码器组成的 LASER3。

Jun, 2023

正则化表示对齐下的跨语言口语理解

本篇论文提出了一种基于正则化和对抗训练的跨语言模型，能够在口语理解系统中实现单词层面和句子层面的跨语言表示对齐，并在少量数据和零样本情况下实现比当前最先进方法更好的性能表现。

Sep, 2020

基于子空间共正则化的多视角学习的跨语言文本分类

该研究提出了一种基于子空间共同正则化多视角学习的新的跨语言文本分类方法，通过机器翻译产生的平行语料库来使不同语言间的标签知识得以转移，该方法在大量跨语言文本分类任务上优于其他归纳方法，领域自适应方法和多视角学习方法。

Jun, 2012

通过表示和梯度规范化提高多语言翻译

本文提出了一种同时在表示层和梯度层面上正则化神经机器翻译（NMT）模型的方法，以解决多语言 NMT 在零 - shot 翻译中出现偏离目标语言及低质量翻译的问题，并在 WMT 和 OPUS 数据集上实现了 5.59 和 10.38 BLEU 的性能提升。

Sep, 2021

从视觉文本表示实现鲁棒性开放词汇翻译

本文提出了使用视觉文本表示（visual text representations）替代有限的文本嵌入向量（finite set of text embeddings），以建立起使用连续词汇（continuous vocabularies）的翻译模型，以此提高模型的稳健性减少了噪声对模型的影响。实验证明，使用视觉文本表示的模型在小型和大型数据集上实现了与传统文本模型相当或更好的表现。

Apr, 2021