Jun, 2021

当代阿姆哈拉语语料库:自动进行形态句法标记的阿姆哈拉语语料库

TL;DR我们介绍了当代阿姆哈拉语语料库,该语料库自动标记词形句法信息,500种不同领域的25199个文档收集了约2400万个拼写单词。由于它是部分网络语料库,因此我们进行了一些自动拼写错误更正。我们还修改了现有的形态分析器HornMorpho,用于标记自动标记。