Apr, 2022

2020 云杉杯:低资源语言词性标注任务概述

TL;DR本研究探讨了不同词性(POS)标注方法的评估框架,并在印度尼西亚语和老挝语的数据集上使用基于特征的和神经网络的方法进行 POS 标注,结果表明神经序列标记模型显着优于经典基于特征的方法和基于规则的方法,其中在印度尼西亚语数据集上的最佳表现达到了 95.82%,在老挝语数据集上为 93.03%。