自编码变分神经机器翻译

Jul, 2018

Auto-Encoding Variational Neural Machine Translation

Bryan Eikema, Wilker Aziz

TL;DR我们提出了一种基于神经网络的双语句子对深度生成模型来进行机器翻译，能够通过共享的潜在表示联合生成源语言句子和目标语言句子，并使用摊余变分推断和重参数化梯度进行高效的训练，可以在领域内、混合领域数据、金标准和合成数据混合学习等各种情况下显示出比条件建模（即标准神经机器翻译）更好的性能。同时，我们讨论了联合建模的统计学意义，并提出了一种高效的近似方法来进行最大后验解码，以便在测试时进行快速预测。

Abstract

We present a deep generative model of bilingual sentence pairs for machine translation. The model generates source and target sentences jointly from a shared latent representation and is parameterised by neural n

neural machine translation deep generative model shared latent representation amortised variational inference maximum a posteriori decoding

发现论文，激发创造

变分神经机器翻译

本文提出了一种变分神经机器翻译编码器 - 解码器模型，引入了一个连续潜变量来明确建模源句子的潜在语义并引导目标翻译的生成，通过神经后验估计技术对该模型进行训练，在中英文和英德翻译任务中实现了显著的性能提升。

May, 2016

条件变分自编码器用于神经机器翻译

探讨使用潜变量模型实现神经机器翻译中的条件文本生成性能，通过引入连续潜变量来增强编码器 - 解码器 NMT 范例，利用 Inference Network 中的共同关注机制来扩展该模型，使用不同方法试图缓解后验崩溃问题，并且探究学习潜空间的能力，该模型能有效地优化翻译模型。

Dec, 2018

联合学习对齐和翻译的神经机器翻译

本文旨在解决传统编码器 - 解码器架构中的长度固定向量制约所面临的性能瓶颈，并提出一种基于（软）搜索方式的新方法，在英法翻译任务中获得了与基于短语的模型相当的翻译性能，且（软）对齐结果与人类直觉相符。

Sep, 2014

变分循环神经机器翻译

本文提出了一种新颖的变分递归神经机器翻译（VRNMT）模型，该模型引入了一系列潜在随机变量以发挥生成效果，这些变量是通过变分自编码器获得的，并且在 NMT 解码器的隐藏状态中包含。使用神经后验近似器和重参数化技术，该模型在汉英和英德翻译任务上实验，取得显着的性能提升。

Jan, 2018

神经机器翻译中的随机解码器

通过深度生成模型，我们提供了一种考虑平行 corpus 中局部语义和句法变化的机器翻译方法，并通过多个语言对的实验验证了其相比基准模型的效果提高。

May, 2018

生成式神经机器翻译

介绍了生成神经机器翻译（GNMT）的概念，通过添加潜在变量提高翻译模型的语义建模能力，从而实现跨语言翻译，半监督学习以及降低过拟合的效果。

Jun, 2018

双语生成式 Transformer 用于语义句子嵌入

本文提出了一种基于变分概率框架的深度潜变量模型，使用双语数据，利用拥有共性的语义信息与特性进行训练，使模型可以将并行语句进行源分离，得到隐含的语义向量，进而对单语数据进行预测。实验证明，该方法在无监督语义相似性评估方面的表现明显优于现有方法，并且还能在不适合使用简单词语重叠作为相似性指标的更难评估子集中发挥最大的作用。

Nov, 2019

反向翻译框架中翻译模型的端到端训练

本篇论文提出了一种基于交叉学习的半监督学习算法，其中使用了背译和变分自编码器以及分类重参技巧来提高机器翻译的质量。

Feb, 2022

通过敌对训练利用多语言能力在低资源神经机器翻译中的应用

本文提出了一个 DAASI 方法用于多语言语言对的句子插值，该方法可通过学习源语言和目标语言的中间潜在表示来优化基于 GAN 的多语言翻译模型。实验证明，在低资源语言对上，该方法的表现超过了现有的最先进方法，性能提高了最多 4 BLEU 分数。

Mar, 2023

重拾零样本神经机器翻译：从潜在变量角度出发

该研究利用深度学习方法，将自然语言翻译应用于零式翻译，提出使用去噪自编码器和支点语言改进零式翻译的传统训练目标，以提高翻译准确性，并在两个基准机器翻译数据集上取得了优异的表现。

Sep, 2021