Sep, 2020

探索使用词性标注嵌入的 Bi-LSTM 和 CRF 在印尼命名实体标记中的应用

TL;DR本文使用深度学习中的长短时记忆模型和条件随机场模型,通过使用 8400 句训练语料和 97 句测试语料,研究了词性嵌入和模型结构对印尼命名实体识别的影响。结果表明,使用词性嵌入作为额外输入有助于提高识别性能,但 Softmax 和 CRF 两种模型结构都存在命名实体分类的弱点。