Oct, 2022

CROP:多语言标注序列翻译实现的零样本跨语言命名实体识别

TL;DR提出了一种跨语言冷启动实体识别框架 (CROP),通过多语言标记序列翻译模型,将目标序列首先翻译为源语言并由源 NER 模型标记,然后采用标记的序列翻译模型将标记的序列投射回目标语言并标记原始句子,最终实现了端到端模型。在两个数据集上进行的实验结果表明,该方法大大优于先前的强基线方法,并实现了最先进的性能。