标志性完整随机投影

Apr, 2018

Sign-Full Random Projections

Ping Li

TL;DR本文提出了一种新的随机投影估计器，其使用期望和正则化方法从数据中估计余弦相似度，并表明在高相似度下，该估计器比标准 Method of 1-bit random projections 更准确。

Abstract

The method of 1-bit ("sign-sign") random projections has been a popular tool for efficient search and machine learning on large datasets. Given two $D$-dim data vectors $u$, $v\in\mathbb{R}^D$, one can generate $x = \sum_{i=1}^D u_i r_i$, and $y = \sum_{i=1}^D v_i r_i$, where $r_i\sim

random projections collision probability cosine similarity estimator maximum likelihood estimator

发现论文，激发创造

随机投影下的节点相似性：极限和病态案例

通过随机投影方法生成的嵌入向量在计算效率上得到了广泛应用，本文进一步研究了随机投影对点积和余弦相似度的保留效果并提供了新的理论结果，找出了病态案例并用数值实验进行了测试，发现对于低度或高度节点，此方法在点积上得到的嵌入向量相对不可靠，而与随机投影引入的统计噪声相比，余弦相似度得到了更精确的近似。

Apr, 2024

扰动和投影：差分隐私的相似性和边际

重新审视了差分隐私的输入扰动框架，介绍了有效算法用于保护隐私的发布余弦相似度和计算多特征边际查询，扩展结果适用于稀疏数据集，提供理论视角解释快速输入扰动算法在实践中的良好表现。

Jun, 2024

使用随机投影进行相关感知的稀疏均值估计

研究了通信高效的分布式向量均值估计问题，在分布式优化和联邦学习中经常使用。通过引入 Rand-Proj-Spatial 估计器，利用交叉客户相关信息提高了通信效率，种种实验证明了其优越性。

Oct, 2023

随机投影的编码

本文研究了随机投影方法下的编码策略对算法表现的影响，发现在相似性度量和线性分类器训练任务中，均匀量化编码比现有方法更优，而在实际应用中，非均匀 2 位编码也表现较好。

Aug, 2013

基于索引的动态完全有向图相关聚类算法

本文研究如何通过建立一个索引来实现针对具有 n 个顶点和 m 个正边的完整带符号图的相关聚类问题的复杂度降低，从而达到 $ O (m + n)$ 的复杂度，同时考虑动态改变环境和非协议度量的结构特性。通过对七个真实数据集进行实验，结果表明相比无索引的算法，我们的基于索引的算法的平均时间减少了 34％。

Jan, 2023

应用于网络图的向量摘要的核心集

提供一种确定性数据汇总的算法来表示用户的好友群体和活动摘要，这可以被用于从 GPS 轨迹或信息交换来识别会议或好友组，并可以标识邻接矩阵中的重要节点。

Jun, 2017

一比特感知，差异和 Stolarsky 原理

通过几何差异理论证明了一种基于符号线性的位域映射方法，利用标准测地线距离在 Sd 球面上和哈明度量在 Hn 上估计了最小整数 n，同时推导了维度修正公式，进一步验证了斯托拉斯基不变原理的类比情形。

Nov, 2015

通过随机投影进行快速最优局部隐私均值估计

提出了一种新的算法框架 ProjUnit，用于保证局部隐私均值估计，该算法框架通过将随机器的输入投影到随机低维子空间并规范化结果，然后在低维空间中运行优化算法来实现计算效率高，通讯复杂度低，并且具有最优误差，同时，通过适当地对设备之间的随机投影矩阵进行相关性，可以实现快速服务器运行时间，最后，实验表明，该算法框架在保持优异的准确度的同时，具有显著较低的通讯和计算成本。

Jun, 2023

基于超立方体的大规模相似度连接、边等周性和距离相关性

该研究探讨了分布式协议用于在大型数据集中查找所有相似向量对的方法，重点关注 Hamming 距离，提出了一种新型组合优化问题来捕捉分析上的核心，展示了边等周形状的设计方法和新的距离相关性界限。

Nov, 2016

基于平均二阶相似性的随机分布式优化：算法与分析

本文研究了具有 n 个客户机的有限和分布式优化问题，针对流行的 δ- 相似性条件和 μ- 强凸性，提出了 SVRS 和 AccSVRS 两种新算法，其通信复杂度分别为 O (n+√(nδ/μ) ) 和 O (n+ n^(3/4)√(δ/μ) )，并显示了接近匹配的下界以验证其紧密性。

Apr, 2023