Jun, 2023

复杂数据集的基础缩放规律和普适性统计结构

TL;DR本文使用统计物理学和随机矩阵理论,探究出现在真实和人造数据集中的普遍特征,发现特征 - 特征协方差矩阵的本地和全局特征值在数据规模方面存在着重要差异,而 Shannon 熵则与局部 RMT 结构和特征值尺度有关,并且与强相关数据集相比于无相关性的人造数据集要小很多。