统计排名的交换代数
使用图 Helmholtzian 和组合 Hodge 理论,基于边缘流的成对排名可以解析为两个正交成分,其中一个表示 L2 最优全局排名,而另一个表示无旋转流,同时还可以通过线性最小二乘回归计算离散的 Hodge 分解。
Nov, 2008
采用基于选择建模的上下文重复选择(CRS)模型,结合多模态模型,提供了生成丰富的排名空间的工具,同时使用结构相关的尾部风险和期望风险界限,对该模型的最大似然估计提供了严格的理论保证,并且在多项式逻辑选择模型(MNL)和 Plackett-Luce(PL)排名模型的预期风险以及 PL 排名模型的尾部风险方面也提供了前所未有的紧密界限。该 CRS 模型在各种场景下明显优于现有的排名数据建模方法,包括比赛和排名投票。
Dec, 2023
本文以代数多样性为数据本身的情况进一步推广了低秩矩阵补全问题,结合仿射子空间集合进行研究,提出了一种有效的基于凸或非凸代价的矩阵补全算法,绕过高维幂律特征矩阵的直接处理,能够恢复合成数据和真实数据,且其性能优于传统的低秩矩阵补全和子空间聚类算法。
Mar, 2017
本研究提出了基于代数几何和拟阵理论的新颖代数组合观点,旨在研究矩阵中少数条目之间的关联。该方法的固有局部性可实现对封闭理论和实践框架中的单个条目进行处理。除了介绍低秩矩阵完成的一种代数组合理论之外,我们还提出了决定矩阵特定条目能否完成的算法,描述了从其他少数条目完成该条目的方法,并估计了完成该条目的任何方法所引入的误差。此外,我们还展示了如何将已知的矩阵完成结果及其采样假设与我们的新视角相关联,并解释了它们在可完成性相变方面的解释。
Nov, 2012
文中提出了一种基于序列或主动排名的算法,该算法基于嘈杂的成对比较将一组 n 个项目排名并将这些项根据其得分分成预先指定大小的集合;本文针对这种算法进行了分析,证明了在某些情况下具有最优性并且不需要任何假设,比如在参数模型下进行的排名。
Jun, 2016
本文提出了一个新的 Bayesian 方法,以实现 Mallows rank 模型的有效计算,并推导出该模型下的共识排序,特别是当考虑到部分排序时,也给出了考虑到评估者个体差异的混合模型,同时在推荐系统中对评估者进行类别预测。
May, 2014
本文介绍了由 Kartsaklis,Ramgoolam 和 Sadrzadeh 引入的语言矩阵理论(Linguistic Matrix Theory)计划,旨在研究基于置换不变多项式函数的矩阵统计学,从组合式分布语义(compositional distributional semantics)中生成的矩阵分布的近似高斯性,介绍了一个单词的可观察向量的几何形状,成功地将此一统一框架应用于计算语言学的许多任务,包括近义词、反义词、上位词和下位词之间的区别。
Feb, 2022
通过将排序模式表达为辫子排列的切片,并且发现所有辫子切片,包括那些未关联到展开模型的切片,都与一个排列的房间一一对应,从中鉴定关联到展开模型的切片,我们得出排序模式的数量,并给出了忽略排列差异时排序模式数量的上限。
Feb, 2010
本研究介绍和归类了联合建模前 k 个部分排序和列表长度 k 的方法,包括将部分排序视为截断总排序的复合模型和将列表构建视为一系列选择决策的增强排序模型。通过使用来自旧金山学校选择和旧金山排名选择选举的部分排序数据,我们评估了这些模型对观测数据的预测能力和生成逼真合成数据集的效果。发现显式将长度建模为分类变量的复合模型能够生成具有准确长度分布的合成数据集,并且具有位置相关的项目效用的增强模型在训练数据中最佳地联合建模了长度和偏好,使用负对数损失进行度量。这项研究成果对模拟和评估征集排序偏好的真实社会系统具有重要意义。
Jun, 2024