Sep, 2012
回归中的相关变量:聚类与稀疏估计
Correlated variables in regression: clustering and sparse estimation
Peter Bühlmann, Philipp Rütimann, Sara van de Geer, Cun-Hui Zhang
TL;DR利用基于规范相关的层次聚类算法,针对强相关的高维线性模型提出了一种首先聚类变量然后进行稀疏估计的方法,其中对聚类代表采用 Lasso 算法或结构基于聚类的组 Lasso 算法进行后续稀疏估计,并给出理论分析和实验证明了该方法的优越性。