Oct, 2023

三星菲律宾研发所参加 WMT 2023

TL;DR本文描述了三星菲律宾研究所在 WMT 2023 普通翻译任务中提交的受限机器翻译系统,涵盖 en$ ightarrow$he 和 he$ ightarrow$en 两个方向。这些系统由基于 Transformer 的序列 - 序列模型组成,在训练过程中采用了一系列最佳实践,如全面的数据预处理流程、合成的反向译文数据以及在线解码时的噪声通道重排序。我们的模型在 FLORES-200 和 NTREX-128 两个公共基准测试数据集上,尽管参数数量明显较少,但性能与强基线无限制系统(如 mBART50 M2M 和 NLLB 200 MoE)相当,有时甚至更好。