Feb, 2020
研究低资源语言数据集的创建、整理和分类方法:塞茨瓦纳语和塞彭迪语
Investigating an approach for low resource language dataset creation, curation and classification: Setswana and Sepedi
Vukosi Marivate, Tshephisho Sefara, Vongani Chabalala, Keamogetswe Makhaya, Tumisho Mokgonyane...
TL;DR该研究主要介绍了如何创建用于塞茨瓦纳语和塞班语的新闻标题数据集,并探讨了数据增强等方法来提高分类器性能。