Sep, 2023

特征域中的数据冗余的概率模型

TL;DR采用概率模型估计大数据集中无相关特征的数量,该模型考虑了特征之间的两两相关性和多个特征之间的相互依赖性,并使用概率方法得出了低相关性和低多重共线性特征集的数量的上下界,我们还证明了互相好的受限集的一个独立的有趣结果。