ACLMar, 2021

英语 - 特威语机器翻译平行语料库

TL;DR本研究提供一份用于英语和 Akuapem Twi 的平行机器翻译训练语料库,其中包含 25,421 组句子对,主要使用 Transformer 为基础的翻译器生成初始的 Akuapem Twi 翻译,并通过由母语为 Akuapem Twi 的人验证和校对以消除翻译错误,同时提供了更高质量的 697 个众包句子,可用于下游自然语言处理任务的评估集。此研究通过 fine-tune transformer 翻译模型在该训练语料库上训练,并在众包测试集上进行性能基准测试,推荐这一数据集用于 Akuapem Twi 机器翻译的进一步训练和评估。