Apr, 2022
2020 云杉杯:低资源语言词性标注任务概述
Yunshan Cup 2020: Overview of the Part-of-Speech Tagging Task for Low-resourced Languages
Yingwen Fu, Jinyi Chen, Nankai Lin, Xixuan Huang, Xinying Qiu...
TL;DR本研究探讨了不同词性(POS)标注方法的评估框架,并在印度尼西亚语和老挝语的数据集上使用基于特征的和神经网络的方法进行 POS 标注,结果表明神经序列标记模型显着优于经典基于特征的方法和基于规则的方法,其中在印度尼西亚语数据集上的最佳表现达到了 95.82%,在老挝语数据集上为 93.03%。