神经机器翻译的语义表征分类

COLINGOct, 2022

Categorizing Semantic Representations for Neural Machine Translation

Yongjing Yin, Yafu Li, Fandong Meng, Jie Zhou, Yue Zhang

TL;DR加入原型引导的源端表示式，减少稀疏性和过拟合，以提高神经机器翻译的组成泛化性能。实验结果表明，该方法在多个机器翻译数据集上比 Transformer 基线方法表现更优。

Abstract

Modern neural machine translation (NMT) models have achieved competitive performance in standard benchmarks. However, they have recently been shown to suffer limitation in compositional generalization, failing to

neural machine translation compositional generalization categorization embedding transformer

发现论文，激发创造

关于神经机器翻译的组合泛化问题

本论文研究了现代神经机器翻译模型的组成泛化问题，构建了包含 216k 个干净和一致的语句对的基准数据集 CoGnition，并通过复合翻译误差率定量分析了各种因素的影响，然后展示了神经机器翻译模型在组成泛化方面的表现欠佳，尽管在传统指标下表现出色。

May, 2021

神经机器翻译中形态丰富输入的组合表示

本文提出用双向循环神经网络替代 NMT 源语言嵌入层，在任何所需的粒度水平上生成组合表示，从而解决基于统计的分词方法中可能导致的形态错误，实现了从字符 N-gram 组成词表示的 NMT 训练方法的一致逆袭。

May, 2018

评估神经机器翻译中的表示层对词性标注和语义标注任务的影响

本文研究了神经机器翻译中不同层面的向量表示的学习情况，并发现高层次对语义的学习更有效，而较低层次对词性标注的学习效果更好。

Jan, 2018

神经机器翻译中语义现象的自然语言推理评估

本文提出一个过程，用于研究神经机器翻译 (NMT) 系统生成的句子表示如何编码不同的语义现象，最终发现编码器最适合在语法 - 语义界面上支持推理，而不是需要世界知识的指代消解。

Apr, 2018

基于语义的神经机器翻译：使用 AMR

研究表明，通过在神经机器翻译中使用抽象意义表示（AMR）作为额外知识，可以显著改善一种强的基于注意力的序列到序列神经翻译模型在标准英德数据集上的翻译表现。

Feb, 2019

神经机器翻译中的结构泛化评估

本研究探讨了机器翻译和语义解析中的复合通用性问题，并发现神经机器翻译模型在句法结构的通用性上存在困难，而语义解析和机器翻译具有不同的性能趋势。

Jun, 2024

利用句子上下文进行神经机器翻译

本研究提出了利用句子上下文进行神经机器翻译的新方法，并在 WMT14 英德和英法基准测试中进行了实验，结果表明，通过利用句子上下文可以提高翻译性能，深度句子上下文可以形成更全面的上下文表示。

Jun, 2019

关于一种基于一致性感知元学习的可靠神经机器翻译方法

本文提出了一种基于一致性感知元学习的神经机器翻译（CoNMT）框架，旨在解决当前 NMT 系统中由源多样性现象导致的翻译错误，实验结果表明，该框架能有效提高翻译质量并可靠地处理输入的多样性。

Mar, 2023

利用图卷积网络在神经机器翻译中挖掘语义

本论文首次将源句子的谓词 - 论元结构（即语义角色表示）信息融入神经机器翻译中，利用图卷积网络将语义偏差注入到句子编码器中，在英语 - 德语语言对上取得了 BLEU 分数上的提高。

Apr, 2018

神经机器翻译中的组合性

本研究探讨了神经机器翻译中组合性的两个具体表现：生产力和系统性，并通过一种简单的预训练机制减轻了编码器的表示不足而显著提高了 BLEU 分数。

Nov, 2019