COLINGJun, 2018

神经机器翻译模型在历史拼写规范化上的评估

TL;DR本文应用不同的 NMT 模型来解决五种语言的历史拼写规范化问题,结果显示 NMT 模型比 SMT 模型在字符错误率方面表现更好,其中 RNN 模型的性能与 GRU/LSTM 类似,Transformer 模型只有在提供更多的训练数据后才有更好的效果,而子词级别的模型在低资源语言中比字符级别的模型表现更好,并提出了一种混合方法进一步提高历史拼写规范化的性能。