ACLApr, 2019
一个基于语境的无监督通用低资源语言词性标注器
A Grounded Unsupervised Universal Part-of-Speech Tagger for Low-Resource Languages
Ronald Cardenas, Ying Lin, Heng Ji, Jonathan May
TL;DR本文描述了一种针对低资源语言的无监督词性标注方法,利用了 Brown 等人在 1992 年提出的经典聚类方法和一种解密方法实现了标注结果的有效构建,并将其应用于 Sinhalese 和 Kinyarwanda 两种极度缺乏标记训练数据的语言中,实现了较高的标注性能。此外,该方法还将集成到真正的零资源模型中,取得了可靠的效果。