Jan, 2017

具有浅层半监督特征的强大多语言命名实体识别

TL;DR通过结合浅层局部信息和聚类半监督特征,我们提出了一种基于跨语言和数据集的稳健性和通用性的多语言实体识别方法,该方法可以无缝地导出到其他数据集和语言中。该系统展示出领先水平,在五种语言和12个数据集中取得了最好的结果,并且无需有语言学动机的特征,也可以在巴斯克语和德语等语言中获得最佳结果,同时削减半监督数据依赖性,对于开发强大的域外模型,聚类特征的重点至关重要。