Oct, 2022
UzbekStemmer: 为乌兹别克语开发一种基于规则的词干提取算法
UzbekStemmer: Development of a Rule-Based Stemming Algorithm for Uzbek Language
Maksud Sharipov, Ollabergan Yuldashov
TL;DR本文介绍了一种基于规则的乌兹别克语词干提取算法,该算法使用基于有限状态机的词缀剥离方法,将词缀分类为 15 个类别并设计为 FSM,最后建立一个基本 FSM,并创建了一个 XML 格式的词缀词典用于开发基于 FSM 的词缀提取应用程序。