ACLApr, 2021
Nguni 语系的规范和表层形态分割
Canonical and Surface Morphological Segmentation for Nguni Languages
Tumi Moeng, Sheldon Reay, Aaron Daniels, Jan Buys
TL;DR本文研究了两种形态学分割方法的监督和无监督模型,并使用序列到序列模型和条件随机场对其进行训练,利用变压器技术在规范化分割上优于带有注意力的 LSTM,并使用基于特征的 CRF 优于双向 LSTM-CRF,在有监督的情况下获得 97.1%的 F1 分数,但在无监督的情况下,该模型的效果并不理想,因此我们希望高性能的监督分割模型将有助于促进发展更好的 NLP 工具。