Aug, 2023

CLASSLA-Stanza:南斯拉夫南斯拉夫语言的语言处理的下一步

TL;DR我们介绍了基于Stanza自然语言处理流水线的南斯拉夫语言的自动语言注释流水线CLASSLA-Stanza,描述了其相对于Stanza的主要改进,并详细描述了最新2.1版本的流水线的模型训练过程。我们还报告了流水线在不同语言和方言上产生的性能分数。CLASSLA-Stanza在所有支持的语言上表现出一致的高性能,并在所有支持的任务上优于或扩展了其父流水线Stanza。我们还介绍了流水线的新功能,能够高效处理网络数据,以及导致其实施的原因。