Feb, 2024

SMOTE 的理论和实验研究:再平衡策略的限制和比较

TL;DRSMOTE 是处理不平衡数据集的常见重平衡策略,它能通过复制原始少数样本来重新生成原始分布,同时在少数分布边界附近 SMOTE 密度消失,验证了常见的边界 SMOTE 策略。我们还介绍了两种新的 SMOTE 相关策略,并将其与最先进的重平衡程序进行比较。我们表明,只有在数据集高度不平衡时才需要重平衡策略,对于这样的数据集,SMOTE、我们的提议或欠采样程序是最佳策略。