Oct, 2018

使用词向量的半监督学习在 Twitter 上进行土耳其语命名实体识别

TL;DR本文基于神经网络的半监督学习方法,利用非监督学习获取的词向量及专门为微博文本设计的语言无关特征,成功生成一种识别土耳其微博文本中命名实体的系统,并在推特信息上表现出较好的 F-score 性能,相比之前提出的 NER 系统有所提升。该方法没有使用任何特定的语言特征,因此可以轻松地适用于其他形态丰富的语言的微博文本。