Oct, 2017

带正则的体积抽样岭回归下采样

TL;DR通过协方差矩阵和预测误差,我们提出了一种选择向量子集的新方法,该方法可以使得使用该子集的岭估计在整个数据集上的平均预测误差具有强大的统计保证,而无需昂贵的标签表。同时,我们对一种联合子抽样过程进行扩展,称之为卷积抽样,并加速迭代过程,以实现与主要独立同分布子抽样过程之一的杠杆分数基本相同的效率。最后,我们理论上和实验上证明了,当标签昂贵时,卷积抽样比任何独立同分布抽样具有明显的优势。