BriefGPT.xyz
Ask
alpha
关键词
news classification
搜索结果 - 3
使用手动和自动标注的机器学习和深度学习方法用于孟加拉语新闻分类
本文介绍了几种机器和深度学习方法,应用于孟加拉语新闻分类。这些方法包括逻辑回归、支持向量机、卷积神经网络以及词向量等,同时提出了自动标记的方法,并在孟加拉语最大的新闻分类数据集 Potrika 上评估了它们的性能。
PDF
2 years ago
Potrika: 八个话题和五个属性的孟加拉语原始平衡报纸数据集
该论文介绍了一种名为 Potrika 的大型单标签 Bangla 新闻文章文本数据集,包括八个区分不同类别的分类属性,为 NLP 研究提供了两个不平衡和平衡的数据集,以适应广泛的 NLP 研究,并且是目前最大、最全面的新闻分类数据集。
PDF
2 years ago
ICLR
Setswana 和 Sepedi 的低资源语言数据集创建、筛选和分类 -- 扩展摘要
研究了自然语言处理技术在低资源语言中的应用,提出了用于塞茨瓦纳语和塞班语头条新闻的数据集及其用于新闻主题分类的基线模型,并探索了一种适合低资源语言的数据增强方法以提高分类器性能。
PDF
4 years ago
Prev
Next