Mar, 2022

改善孟加拉语假新闻检测性能的方法:平衡处理和模型堆叠

TL;DR本文介绍了多种解决不平衡数据集问题的方法,同时提出了一种能够在数据不平衡时提高性能的技术,并将其应用于 BangFakeNews 数据集,结果表明使用数据操纵技术,如 SMOTE,可以获得 93.1% 的 F1 分数,而使用非数据操纵方法,如 Stacked Generalization,则可以获得 79.1% 的 F1 分数。