光谱排序
使用特征谱方法从现代统计的角度系统、全面且易于访问地介绍了一类从数据中构建矩阵,然后使用上述矩阵的特征向量(Singular vectors)和特征值(Singular values)进行数据分析的方法。特别地,我们围绕着多个中心问题来阐述这些方法在各种大规模应用中的算法含义,如何表征这些方法在达到目标统计精度时的样本效率,以及如何评估它们在随机噪声、缺失数据和敌对损坏面前的稳定性?
Dec, 2020
给定多个项目之间的成对比较,如何对它们进行排名,以使得排名与观察结果相匹配?本研究关注基于 Erdos-Renyi 异常值(ERO)模型的排名问题,在该问题中,每个成对比较都是真实分数差异的损坏副本。通过研究基于非归一化和归一化数据矩阵的谱排名算法,我们提供了每个项目从观察数据中恢复出其潜在分数的性能,并得出了非归一化 / 归一化数据矩阵的最大特征向量与其总体对应物之间的逐项扰动误差界限。通过留一法技术,我们提供了更精确的最大特征向量的 l∞范数扰动界限,并在只有 Ω(nlogn) 个样本的情况下导出了每个项目的最大偏移误差界限。理论分析在样本复杂度方面改进了现有技术的结果,并通过数值实验验证了这些理论发现。
Sep, 2023
本文提出了一种用于排序一系列物品的序列算法,将基于成对比较构建相似性矩阵后使用序列方法进行排序。在排名恢复和噪声处理方面,它比传统评分方法更具鲁棒性,并且还可以解决半监督排名问题。使用该算法进行排名的表现竞争性更好。
Jun, 2014
本文探究了实际图形的频谱密度,并借用凝聚态物理学的工具及其适应性处理常见的图形模式的频谱签名。通过计算具有十亿边缘的图形的频谱密度来展示其高效性。同时,证明频谱密度的估计促进了许多常见的中心度量的计算,并使用频谱密度估计了有关图形结构的有意义信息,这些信息不能仅通过极值特征对推断得出。
May, 2019
本文介绍了一种基于谱方法的元学习器,可以在只有多个分类器的推荐或预测的情况下,可靠地排名它们,并构建一个比大多数组合中的分类器更准确的元分类器。该方法假设分类器之间具有条件独立性,并通过计算其协方差矩阵和特征向量进行排名,并进一步引入谱元学习器作为组合加权分类器。该方法在模拟和真实数据上达到了比大多数分类器更高的准确性。
Mar, 2013
该研究论文介绍了基于张量分解方法的高阶时刻谱方法及其计算技术,也提出了一个名为 Tensorly 的 Python 数组操作工具, 具有良好的灵活性和兼容性,能够与多种深度学习框架结合使用来学习广泛的潜在变量模型。
Apr, 2020
本文通过对核谱聚类方法进行首次分析,发现在维度和数量同时增长的情况下,核矩阵的归一化拉普拉斯矩阵与所谓的尖峰随机矩阵呈类似的渐近行为。通过一种如尖峰矩阵模型的可分离条件,证明该模型中的一些孤立特征值 - 特征向量对携带聚类信息。我们精确评估了这些特征值的位置和特征向量内容,在理论和实践角度揭示了核谱聚类中非常重要(有时相当破坏性)的方面。最后将结果与 MNIST 数据库中图像实际聚类的性能进行比较,证明了理论和实践之间的重要匹配。
Oct, 2015
本文介绍了拉普拉斯矩阵的第二特征值和相关特征向量在无向图中的基本特征,并提出了第二特征向量的局部偏差模型,用于半监督方式下确定数据图的本地性质和优化问题,从而可以在近线性时间内计算最优解,并提供了在社交和信息网络中找到具有局部偏差的稀疏线性切割的详细实证评价。
Dec, 2009
本研究旨在探究相位恢复系统中采用随机正交向量矩阵的谱方法启动的局部搜索算法。我们在渐进的情况下,获得了谱估计器和真实信号向量之间的最大重叠程度的简单表达式。
Mar, 2019