ACLApr, 2023
NLP-LTU 在 SemEval-2023 任务 10 中:数据增强和半监督学习技术对不平衡数据集上文本分类性能的影响
NLP-LTU at SemEval-2023 Task 10: The Impact of Data Augmentation and Semi-Supervised Learning Techniques on Text Classification Performance on an Imbalanced Dataset
Sana Sabah Al-Azzawi, György Kovács, Filip Nilsson, Tosin Adewumi, Marcus Liwicki
TL;DR本文提出了一种在社交媒体帖子中检测和分类在线性别歧视的方法,使用了 BERTweet、RoBERTa 和 DeBERTa 等 fine-tuned transformer-based 模型,并采用数据增强和半监督学习来改善模型的泛化能力和应对类别不平衡问题,在 SubtaskA 获得了 0.8613 的 F1 得分,排名第十。