ACLApr, 2021

Nguni 语系的规范和表层形态分割

TL;DR本文研究了两种形态学分割方法的监督和无监督模型,并使用序列到序列模型和条件随机场对其进行训练,利用变压器技术在规范化分割上优于带有注意力的 LSTM,并使用基于特征的 CRF 优于双向 LSTM-CRF,在有监督的情况下获得 97.1%的 F1 分数,但在无监督的情况下,该模型的效果并不理想,因此我们希望高性能的监督分割模型将有助于促进发展更好的 NLP 工具。