Aug, 2023
基于多标签的吉尔吉斯语主题分类评估
Benchmarking Multilabel Topic Classification in the Kyrgyz Language
Anton Alekseev, Sergey I. Nikolenko, Gulnara Kabaeva
TL;DR我们提供了一个针对柯尔克孜语的主题分类的新公共基准,介绍了一个基于来自新闻网站 24.KG 的收集和注释数据的数据集,并提出了多标记设置下新闻分类的几个基准模型。我们训练和评估了经典统计模型和神经模型,报告了分数,讨论了结果,并提出了未来工作的方向。