COLINGAug, 2018

命名实体音译中的设计挑战

TL;DR本文探讨了多语种最新命名实体转写系统的一些基本设计挑战,并使用传统的加权有限状态转换器方法对两种神经方法进行实证评估:编码器 - 解码器循环神经网络方法和最近的非顺序 Transformer 方法。为了提高双语命名实体转写数据集的可用性,我们在英语到俄语、希伯来语、阿拉伯语和日语片假名方面发布了从维基数据中构建的个人命名双语词典。我们的代码和词典已经公开发布。