MMJun, 2019

预处理对阿拉伯语 - 英语统计和神经机器翻译的影响

TL;DR本文系统比较了优秀的神经网络与基于统计学的机器翻译模型在不同华丽的预处理令牌方案下的阿拉伯语 - 英语翻译数据,并考虑对于这两种方法数据和词汇量的大小对性能的影响。实证结果显示,最佳的语言学基础令牌化方案的选择在于模型类型和数据规模的大小,并且使用神经网络与统计学的机器翻译输出的系统选择可以获得显著的性能提升。