Oct, 2023

带有约束解码和大型语言模型提示的术语感知翻译

TL;DR在机器翻译的下游应用中,术语的正确性非常重要,通过将术语约束注入翻译系统可以实现。本研究采用一种翻译后再优化的方法,可以实现跨领域且需要较少手动操作。我们通过使用从词对齐中获得的伪术语翻译来注释随机源词,首先训练一个术语感知模型。此外,我们还探索了两种后处理方法。第一,我们使用对齐过程来发现是否违反了术语约束,如果是,则使用负面约束对违反术语的词进行重新解码。或者,我们利用大型语言模型通过提供术语约束来优化假设。结果表明,我们的术语感知模型能够有效地学习并整合术语,而大型语言模型优化过程可以进一步提高术语的召回率。