May, 2023

基于语法和句法的乌克兰语语料库分析工具

TL;DR该研究提供了一个文本挖掘工具 StyloMetrix 的概述,该工具最初为波兰语开发,后来扩展为英语和乌克兰语。研究人员使用计算语言学家和文学研究人员手工制作的各种度量衡来构建统计评估句法和语法特征的思路是直接而熟悉的,但对于乌克兰语等低资源语言,该工具仍需开发。该论文描述了 StyloMetrix 的流程和用于文本分类任务的一些实验,同时也描述了该包的主要限制和度量衡的评估程序。