ACLOct, 2022

探索分割方法用于神经机器翻译双语代码混合的埃及阿拉伯语 - 英文文本

TL;DR在研究中,我们探究了不同分词方法在从阿拉伯语和英语混合语境中进行机器翻译时的效果。实证结果表明,有意识考虑词形的分词器在分词任务中效果最佳,但在机器翻译中表现不佳。在数据非常稀缺的情况下,采用词频和基于词形的组合进行分词是最有效的。