数据驱动的排名破坏用于高效的排名聚合
本文对于大规模和异构化的现代数据集中的信息排序问题提出了一种可靠性保证的机制,通过有序的信息刻画,充分利用计算资源进行高效程度排名的学习并在特定数据结构下进行了验证。
Aug, 2016
通过对强有力的潜在对手进行在线攻击,从博弈论的视角提出了一种关于排名聚合方法的对抗性操纵解决方案,并展示了如何通过顺序操纵策略在具有完全知识或不完全知识的 attackers 下实现最优效果。
Jul, 2024
给定多个项目之间的成对比较,如何对它们进行排名,以使得排名与观察结果相匹配?本研究关注基于 Erdos-Renyi 异常值(ERO)模型的排名问题,在该问题中,每个成对比较都是真实分数差异的损坏副本。通过研究基于非归一化和归一化数据矩阵的谱排名算法,我们提供了每个项目从观察数据中恢复出其潜在分数的性能,并得出了非归一化 / 归一化数据矩阵的最大特征向量与其总体对应物之间的逐项扰动误差界限。通过留一法技术,我们提供了更精确的最大特征向量的 l∞范数扰动界限,并在只有 Ω(nlogn) 个样本的情况下导出了每个项目的最大偏移误差界限。理论分析在样本复杂度方面改进了现有技术的结果,并通过数值实验验证了这些理论发现。
Sep, 2023
本论文探讨了不完整排序数据以及基于 Plackett-Luce 分布的完整排序数据下的各种排序方法的表现,提出了考虑等级相关粗化的概念,并研究了当样本大小趋近于无穷大时,是否存在偏差导致恢复目标排序的一致性问题。
Dec, 2017
本文提出了一种协同偏好完成问题的高效算法,涉及在基于有限数量的观测关联值的情况下,针对一组实体在共享的项目集上联合估计个性化排名。该算法利用了一个观察结论,即虽然偏好通常被记为数字分数,但感兴趣的预测量实际上是底层排名,因此,直接拟合底层偏好顺序的估计器结合核范数约束来鼓励低秩参数。尽管具有广泛适用性,但该算法对于表示总体或区块总体顺序的监督的计算复杂度与基于核范数规则化估计的矩阵完成标准算法相差不大。此外,本文还提出了一项挑战性应用,即协同排名脑区与认知神经科学术语之间的关联。
Nov, 2016
使用图 Helmholtzian 和组合 Hodge 理论,基于边缘流的成对排名可以解析为两个正交成分,其中一个表示 L2 最优全局排名,而另一个表示无旋转流,同时还可以通过线性最小二乘回归计算离散的 Hodge 分解。
Nov, 2008
本文提出了一种迭代的排名聚合算法 ——Rank Centrality,该算法基于随机游走解释,用于发现从成对比较中学习出的对象分数。该算法的有效性以 Bradley-Terry-Luce(BTL)模型为例,并通过边界收敛速度分析方法估计出了对 BTL 模型假定分数与算法估计分数之间的有限样本误差率。
Sep, 2012
本文提出了一种新的学习排序算法 Pareto Pairwise Ranking,该算法不仅在技术准确度方面表现出色,而且在公平性方面是目前 9 种现行算法中最公平的算法。
Dec, 2022