May, 2018

基于Lattice LSTM的中文命名实体识别

TL;DR本文研究了一种基于格子结构的LSTM模型用于汉语命名实体识别,在编码一系列输入字符的同时,还编码与词典匹配的所有潜在词。与基于字符的方法相比,我们的模型明确利用了单词和单词序列信息。与基于单词的方法相比,格内LSTM不受分割错误的影响。门控循环单元允许我们的模型从句子中选择最相关的字符和单词以达到更好的命名实体识别结果。各种数据集上的实验表明了格内LSTM优于基于单词和字符的LSTM基线,取得了最佳结果。