Nov, 2019

适用于形态复杂语言的特征丰富的词性标注:以保加利亚语为例

TL;DR本文针对保加利亚语 (一种具有丰富的屈折和派生形态的斯拉夫语言) 进行了词性标注实验,并结合大型形态学词典、先前的语言知识以及基于 POS 注释语料库的有指导性学习方法,使用 680 个形态语法标记,实现了 97.98% 的准确率,这是对保加利亚语的最新技术的显着改进。