Mar, 2019

弱特征的双下降模型

TL;DR本文提出了 “双下降” 风险曲线,用于定性描述可变参数机器学习模型的样本外预测准确性。通过对最小二乘 / 最小规范预测器的两个简单数据模型进行精确的数学分析,显示出风险在特征数 $p$ 接近样本数 $n$ 时达到峰值,但随着 $p$ 超过 $n$ 而逐渐降低至最小值。而这种行为则和需要提前确定最优特征序列的 “先知” 模型有所不同。