统计排名与组合霍奇理论

Nov, 2008

Statistical ranking and combinatorial Hodge theory

Xiaoye Jiang, Lek-Heng Lim, Yuan Yao, Yinyu Ye

TL;DR使用图 Helmholtzian 和组合 Hodge 理论，基于边缘流的成对排名可以解析为两个正交成分，其中一个表示 L2 最优全局排名，而另一个表示无旋转流，同时还可以通过线性最小二乘回归计算离散的 Hodge 分解。

Abstract

We propose a number of techniques for obtaining a global ranking from data that may be incomplete and imbalanced -- characteristics almost universal to modern datasets coming from e-commerce and internet applications. We are primarily interested in score or rating-based cardinal data.

global ranking pairwise ranking graph helmholtzian combinatorial hodge theory l1-projection

发现论文，激发创造

霍奇 - 符合边缘高斯过程

我们提出了基于原理的高斯过程（GPs）来建模在简单二维复合物的边集上定义的函数，一种类似于图形的结构，在其中边可以形成三角面。这种方法旨在用于学习在边流可以由离散的散度和旋度描述网络上的流动类型数据。

Oct, 2023

通过谱方法改进的排名聚合的理论保证

给定多个项目之间的成对比较，如何对它们进行排名，以使得排名与观察结果相匹配？本研究关注基于 Erdos-Renyi 异常值（ERO）模型的排名问题，在该问题中，每个成对比较都是真实分数差异的损坏副本。通过研究基于非归一化和归一化数据矩阵的谱排名算法，我们提供了每个项目从观察数据中恢复出其潜在分数的性能，并得出了非归一化 / 归一化数据矩阵的最大特征向量与其总体对应物之间的逐项扰动误差界限。通过留一法技术，我们提供了更精确的最大特征向量的 l∞范数扰动界限，并在只有 Ω(nlogn) 个样本的情况下导出了每个项目的最大偏移误差界限。理论分析在样本复杂度方面改进了现有技术的结果，并通过数值实验验证了这些理论发现。

Sep, 2023

基于稀疏随机图的 HodgeRank 众包采样策略分析

本文分析了 HodgeRank 估算器的两种随机抽样方法 —— 有替换和无替换的方法，并使用随机图理论中的工具来测量估算器的稳健性，提供了这两种随机图模型的 Fiedler 值的新估计，基于我们的发现，对于需要比较的项目较少的情况下，我们建议采用两阶段取样策略，并在第二阶段采用无替换的随机取样方法。而对于需要比较的项目较多的情况，则建议使用带替换的随机取样方法，此方法计算廉价且易于并行化。

Feb, 2015

直接优化排序度量

介绍了一种新的优化丢失功能的方法以提高 Web 页面排名和协同过滤的性能，并使用结构化估计在希尔伯特空间中进行直接优化，所提出的算法被证明是快速且表现良好。

Apr, 2007

通过稀疏胞复合物在图上表示边流

本文将利用相关的 Hodge 拉普拉斯矩阵的特征向量以及对应的单纯复形的关联矩阵进行 Hodge 分解，为观测数据提供梯度、旋度和谐波流形式的稀疏、可解释表示，从而解决了在图的边缘流中获得稀疏、可解释表示的问题，并通过引入一种高效的近似算法来解决本文介绍的细胞推断优化问题。实验结果表明，该算法在真实数据和合成数据上表现优于当前最先进的方法，并且计算效率高。

Sep, 2023

随机排名：无标度离散函数的全局优化

该研究提出了一个用于直接优化排名度量的高效框架 ——CatBoost，并介绍了两种重要的技术：随机平滑和基于部分积分的新梯度估计，证明了经典平滑方法可能会引入偏差，并提出了一个通用解决方案进行去偏差，该算法保证全局收敛性并在多个学习排名数据集上优于现有方法。

Mar, 2020

我们需要多少两两比较偏好才能一致地排名图表？

提出一种称为 Pref-Rank 的算法，它利用结构丰富的图形嵌入来预测排名。通过在坐标点上建立强乘积空间，该算法通过 SVM 方法从结果图嵌入中提取关键信息并在两种排序 Loss 上提供了统计一致性。实验结果表明，此算法优于现有的状态 - of-the-art 方法。

Nov, 2018

网络高效排名的物理模型

该论文提出了一种基于物理学原理的模型和高效算法，用于推断有向网络中节点的层次排名，并介绍了一种更精确的排名方式，并提供了一种对强度进行统计显著性检验的方法，应用于预测边的存在性和方向，并在实际和合成数据上分析展示出算法的效率与可扩展度。

Sep, 2017

普通图和局部图的成对比较排名

本文关注 Bradley-Terry-Luce 模型中的成对比较问题，并通过对图论的分析，提出了能够在有限条件下对排名进行准确估计的算法，并在大规模实验中证实了该算法的可行性。

Apr, 2023

简单、健壮且最优排名的配对比较

本研究旨在通过成对比较的数据形式，使用 Copeland 计数算法实现对 n 个项目的排序，使其具有计算效率高，鲁棒性强，接近信息论极限等特点，并将结果扩展到汉明距离度量下的近似恢复问题和任意错误要求条件下的恢复问题。

Dec, 2015