带有约束解码和大型语言模型提示的术语感知翻译

Oct, 2023

带有约束解码和大型语言模型提示的术语感知翻译

Terminology-Aware Translation with Constrained Decoding and Large Language Model Prompting

Nikolay Bogoychev, Pinzhen Chen

TL;DR在机器翻译的下游应用中，术语的正确性非常重要，通过将术语约束注入翻译系统可以实现。本研究采用一种翻译后再优化的方法，可以实现跨领域且需要较少手动操作。我们通过使用从词对齐中获得的伪术语翻译来注释随机源词，首先训练一个术语感知模型。此外，我们还探索了两种后处理方法。第一，我们使用对齐过程来发现是否违反了术语约束，如果是，则使用负面约束对违反术语的词进行重新解码。或者，我们利用大型语言模型通过提供术语约束来优化假设。结果表明，我们的术语感知模型能够有效地学习并整合术语，而大型语言模型优化过程可以进一步提高术语的召回率。

Abstract

terminology correctness is important in the downstream application of machine translation, and a prevalent way to ensure this is to inject terminology constraints into a translation system. In our submission to t

terminology correctness machine translation terminology constraints translation system terminology-aware model

发现论文，激发创造

训练神经机器翻译应用术语约束

本文提出了一种新颖的方法，在神经机器翻译中运行时注入自定义术语。作者通过训练神经机器翻译系统学习如何在输入时使用自定义术语，并比较实验证明这种方法不仅更有效，而且与自由约束解码一样快。

Jun, 2019

领域术语整合到机器翻译：利用大型语言模型

本文介绍了我们在德英（DE-EN）、英捷（EN-CS）和中英（ZH-EN）语言对上提交给 WMT 2023 术语共享任务的方法，通过使用大型语言模型（LLMs）生成二语合成数据并将预批准术语整合入机器翻译（MT）中，成功地提高了术语的使用率。

Oct, 2023

自动后编辑中的术语限制

本文提出了自回归模型和非自回归模型用于词汇约束的自适应编辑，实验表明可保留 95% 的术语并提高英德基准翻译质量；虽然应用于词汇约束 MT 输出，但模型学习不会系统地复制约束，因此提出并使用简单的数据增强技术以提高性能和鲁棒性。

Oct, 2020

鼓励神经机器翻译满足术语限制

本文提出了一种新的方法，通过训练步骤来鼓励神经机器翻译满足词汇约束，其主要包括训练数据扩充、约束词汇掩码和交叉熵损失函数修改三个方面，实验表明该方法在 BLEU 分数和生成约束词汇的数量方面均优于其他算法。

Jun, 2021

使用术语约束的神经机器翻译解码

本研究描述了基于有限状态机和多堆栈解码的受约束神经机器翻译解码方法，支持目标端约束以及对应对齐输入文本跨度的约束条件，在多个翻译任务上表现出较好的性能，通过注意力受约束解码的方式减少用户约束翻译时的错置和重复。

May, 2018

利用目标词元注释促进术语翻译

该研究提出了一种源数据增强的机器翻译系统，用于术语集成，实验表明该方法在术语翻译时具有实用性和较高的准确性。

Jan, 2021

利用 Levenshtein 变换的受词汇约束的神经机器翻译

本文提出了一种在神经机器翻译中加入词汇约束的简单有效算法，该算法可以在推理时注入术语约束，而不影响解码速度，并且无需修改训练流程，使用自定义字典即可运行，实验结果表明，我们的方法在英德 WMT 数据集上可以提高基线和之前方法的翻译质量。

Apr, 2020

使用大型语言模型的自适应机器翻译

本文旨在探究如何利用上下文学习的方法来提高实时自适应机器翻译的质量，并研究将强编码器 - 解码器模型和模糊匹配相结合以进一步提高翻译质量的方法。已在五个大不同的语言对上展开了实验。

Jan, 2023

利用源条件掩蔽跨度预测提高词汇约束的神经机器翻译

本文提出了一种简单有效的训练策略，通过应用掩蔽跨度预测模型，实现了对两种语言的三个特定领域语料库在术语级和句子级翻译方面的持续改进，以解决神经机器翻译系统术语翻译的实用性和可靠性问题。

May, 2021

带有噪声词汇约束的神经机器翻译

本文提出了一种新的框架，将用户提供的限制条件作为外部记忆存储，并以柔性方式进行处理，从而解决在现实世界中限制条件可能存在的问题，实验结果表明，我们的方法能够在处理嘈杂的限制条件时取得相当大的 BLEU 收益，这些结果使我们能够将所提出的方法应用于不需要用户帮助生成限制条件的新场景中并证明了该方法确实能够提高自动生成的约束下的翻译质量。

Aug, 2019