Apr, 2023

巴西葡萄牙语文本分类数据增强方法的性能

TL;DR使用数据扩增方法来改善文本分类问题的机器学习性能,本文研究了几种数据扩增技术在巴西葡萄牙语语料库上的表现,并发现其中一些方法的表现有所改善,但也指出了语言偏见和非英语文本数据匮乏的进一步利用。