- ACL基于格点的 Transformer 编码器用于神经机器翻译
通过引入基于格的编码器,本研究旨在探索有效的单词或子单词表示形式,进而提高基于 Transformer 的神经机器翻译的性能。实验证明,这种新型编码器在单词水平和子单词水平的表示方面优于传统的 Transformer 编码器。
- 多语言神经机器翻译中的迁移学习和动态词汇
本研究提出了一种神经机器翻译(NMT)模型间的知识转移方法,通过共享动态词汇表来适应新语言,以达到提高翻译性能的目的,并在多种语言方向上进行了实验,结果表明具有良好的性能。
- 提高语音翻译的稳健性
提出了一种简单且有效的方法来改进神经机器翻译在语音翻译中的稳健性,通过在干净的平行数据集中注入真实输出中存在的噪声以及结合拼音特征,使 NMT 可以在类似的单词分布下进行训练和测试,实验结果表明,该方法在多个噪声测试集上的稳定性表现优异,并 - COLING利用关系网络对神经机器翻译的源表示进行精炼
研究采用关系网络来提高神经机器翻译中对于远距离信息的记忆能力,并在多个数据集上验证该方法能够显著提高翻译性能,超越传统编码器 - 解码器模型和使用监督句法知识的方法。
- IJCAI神经机器翻译中的短语表作为推荐记忆
本文提出了一种使用短语表作为推荐记忆来缓解神经机器翻译中生成流畅但不忠实的问题的方法,实验结果表明,该方法在注意力机制的基础上取得了显著的改进。
- ACL使用术语约束的神经机器翻译解码
本研究描述了基于有限状态机和多堆栈解码的受约束神经机器翻译解码方法,支持目标端约束以及对应对齐输入文本跨度的约束条件,在多个翻译任务上表现出较好的性能,通过注意力受约束解码的方式减少用户约束翻译时的错置和重复。
- AAAI使用重建模型翻译 Pro-Drop 语言
本文提出了一种新颖的基于重构的方法来解决神经机器翻译中省略代词问题,自动提取并重构源语句使得神经机器翻译模型能够更好地嵌入被注释的代词信息,该方法显著和一致地提高了中英和日英对话翻译任务的翻译性能。
- ACL神经机器翻译的过去与未来建模
我们提出了一种新的机制来将源信息分成已翻译的过去内容和未翻译的未来内容,并使用两个附加的循环层对其进行建模,从而为神经机器翻译系统提供已翻译和未翻译内容的知识,实验结果表明,该方法显著改善了中英、德英和英德翻译任务的翻译性能,具体来说,该模 - EMNLP神经机器翻译的动态数据选择
本研究探讨了数据选择技术在神经机器翻译方面的应用,介绍了一种逐步微调的动态数据选择方法,并展示了该方法在数据选择方面的领先优势。
- 神经机器翻译的束搜索策略
本文提出了通过改进灵活的 beam-search decoder 来加速神经机器翻译的方法,并测试表明,该方法可以提高速度,同时不影响翻译质量。
- 神经机器翻译的快速领域适应
本文介绍了一种适应新领域的神经机器翻译(NMT)系统,并展示了在两种语言对上,适应方法相比于常用方法在自动和人工评估测量标准下的显著性提升,而一般领域性能仅略有下降,适应过程快速且不需要重新训练 NMT 模型。
- 多模态编解码网络带多媒体中心的零资源机器翻译
使用多模式嵌入表示法构建神经机器翻译系统,在没有平行语料库的情况下,通过图像和文本信息之间的相关性间接估计两种语言之间的相关度,并在最终测试阶段中,只需要源语言的文本作为翻译输入。在实验中,我们使用端到端模型优化多模态编码器中的排序损失和解 - COLING神经机器翻译的交互式注意力
本研究提出了一种名为 INTERACTIVE ATTENTION 的注意力机制,可以通过读写操作来建模解码器与源句子表示之间的交互,从而跟踪交互历史并提高翻译效果,实验结果表明,与基线和某些注意力机制的改进相比,使用 INTERACTIVE - 神经机器翻译一句话一模型
本篇论文提出了动态神经机器翻译 (Dynamic NMT) 的方法,通过对测试句子进行微调以适应具体场景,从而显着提高翻译性能。该方法特别适用于高度相似的句子。
- ACL基于协议的非平行语料库并行词汇和短语学习
我们介绍了一种基于协议的方法来学习非平行语料库中的平行词汇和短语。我们通过鼓励两个不对称的隐变量翻译模型(即源至目标和目标至源)达成一致,同时在单向模型的词和短语级别定义一致性。我们开发了一个 Viterbi EM 算法来高效地联合训练这两 - 神经机器翻译中使用非常大的目标词汇量
本文提出了一种基于重要性采样的方法,使我们可以使用非常大的目标词汇,有效地进行解码,可以优于基准模型和 LSTM-based 神经机器翻译模型,并使用多个模型集成实现了英 -> 德翻译的最先进性能(由 BLEU 度量)。
- ICLR联合学习对齐和翻译的神经机器翻译
本文旨在解决传统编码器 - 解码器架构中的长度固定向量制约所面临的性能瓶颈,并提出一种基于(软)搜索方式的新方法,在英法翻译任务中获得了与基于短语的模型相当的翻译性能,且(软)对齐结果与人类直觉相符。