Jun, 2013

本地病例 - 对照抽样:解决非平衡数据集中的高效子采样问题

TL;DR本文提出了一种利用接受 - 拒绝机制,在特征空间中调整局部类别平衡的逻辑回归子采样方法,其偏倚的子采样通过后期分析参数调整得到校正。实验证明,该方法在处理分类问题中的显著类别不平衡时,能够比标准的病例 - 对照子采样获得更好的效果。