MMApr, 2017

基于分支熵选择大词汇量的神经机器翻译模型

TL;DR本文基于分支熵的统计方法,提出一种扩展词汇表的神经机器翻译方法,使其适用于翻译专利文件等包含大量罕见技术术语的情况。通过对选定的短语进行 SMT 短语翻译表替换,达到显著的机器翻译错误减少和翻译精度提升。