ACLMay, 2018

双语字符表示以有效地解决语码混杂命名实体识别中的生词问题

TL;DR本文提出一种基于 LSTM 模型的层次结构,在命名实体识别中使用双语字符表征和迁移学习来解决词汇表外单词的问题,并提出使用标记替换和规范化减轻数据噪声。在第三届计算语言代码切换共享任务中,我们在不使用任何专用词典和基于知识的信息的情况下,在英语 - 西班牙语语言对中获得了第二名,和 62.76% 的谐波平均 F1 分数。