May, 2024

追随 COMET:利用最小贝叶斯风险解码实现自我改进的机器翻译

TL;DR本文研究了最小贝叶斯风险(MBR)解码在自我改进机器翻译(MT)中的应用,特别是针对领域适应和资源匮乏的语言。通过使用 COMET 作为 MBR 效用度量,我们实现了在 MBR 解码的正向翻译上微调模型的自我改进过程,旨在实现与人类偏好更为一致的翻译重新排名。该文探讨了这种方法的迭代应用和可能需要语种特定 MBR 效用度量的潜在需求。结果显示,在所有考察的语言对中,包括领域适应模型的成功应用和对资源匮乏环境的泛化,都显著提高了翻译质量。这突显了 COMET 指导的 MBR 在各种场景下实现高效 MT 自我改进的潜力。