Jul, 2022

评估阿塞拜疆语神经机器翻译

TL;DR本研究对使用不同技术和数据集的阿塞拜疆语 - 英语 NMT 系统进行表现基准测试,并评估哪种分段技术在阿塞拜疆语翻译中效果最佳。结果显示,虽然 Unigram 分割可以提高 NMT 性能,而且阿塞拜疆语翻译模型随着数据集质量而不是数量的提高而具有更好的规模性,但跨域泛化仍然是一个挑战。