MMOct, 2013

使用统计方法开发马拉地语词性标注器

TL;DR本文介绍了一种基于统计模型的马拉地语词性标注器的开发方法,使用 Unigram、Bigram、Trigram 和 HMM 方法,以 77.38%、90.30%、91.46%和 93.82%的准确率作为评估指标,并提出了一个用于标记马拉地文本的标记集。