Apr, 2021
Nguni语系的规范和表层形态分割
Canonical and Surface Morphological Segmentation for Nguni Languages
TL;DR本文研究了两种形态学分割方法的监督和无监督模型,并使用序列到序列模型和条件随机场对其进行训练,利用变压器技术在规范化分割上优于带有注意力的LSTM,并使用基于特征的CRF优于双向LSTM-CRF,在有监督的情况下获得97.1%的F1分数,但在无监督的情况下,该模型的效果并不理想,因此我们希望高性能的监督分割模型将有助于促进发展更好的NLP工具。