Feb, 2024

AlbNews:用于阿尔巴尼亚语主题建模的标题语料库

TL;DR本论文介绍了 AlbNews,这是一个包含 600 个主题标记的阿尔巴尼亚新闻标题和 2600 个未标记标题的集合,可用于进行主题建模研究。我们报告了一些传统机器学习分类器使用 AlbNews 样本进行训练的初始分类分数。结果显示基本模型超过了集成学习模型,并可作为未来实验的基准。