Jan, 2011

最优加权最近邻分类器

TL;DR本文通过渐近分析导出了带权最近邻分类器超额风险(遗憾)的渐近展开式,并找到了非负权重的渐近最优向量,表明该分类器的遗憾与未加权的 k - 最近邻分类器相比,仅与特征向量的维度有关。同时,在更大的维度上,权重最优。最后,我们还证明,当允许使用负权重时,强平滑假设是可能提高收敛速度的。本文的结果得到了在模拟数据和真实数据集上的实证对比支持。