ACLApr, 2019

一个基于语境的无监督通用低资源语言词性标注器

TL;DR本文描述了一种针对低资源语言的无监督词性标注方法,利用了 Brown 等人在 1992 年提出的经典聚类方法和一种解密方法实现了标注结果的有效构建,并将其应用于 Sinhalese 和 Kinyarwanda 两种极度缺乏标记训练数据的语言中,实现了较高的标注性能。此外,该方法还将集成到真正的零资源模型中,取得了可靠的效果。