Nov, 2022

使用 ParsBERT 和不平衡数据处理方法的波斯情感检测

TL;DR本文旨在评估和比较两种标记好的波斯语情感数据集(EmoPars 和 ArmanEmo)的性能,并通过使用数据增强技术、数据再平衡、类别权重和 Transformer-based Pretrained Language Models 等方法,解决数据不平衡问题,并提供了一种从高置信度样本中选择数据的策略,并在这些数据集上实现了 F1 分数的最优结果。