- 多重光散射中的随机投影:光速逼近内核函数
介绍了一种基于相干光在随机介质中的多重相干散射的物理特性,能够在光速下进行随机投影的模拟光学器件,可用于大型训练集和实时预测的核方法实现,避免了在存储随机矩阵和使用其他结构化矩阵以减少计算和内存成本时的复杂问题。通过在 MNIST 数据库上 - NIPS压缩谱嵌入:避开 SVD
本文提出一种基于随机投影与有限阶多项式拓展计算奇异值分解嵌入的压缩光谱嵌入算法,其降维效果与计算复杂度不受特征向量数量影响。此算法对聚类和分类等下游推断任务的对比相似度度量具有较好效果。
- MM可分主题发现的充分必要条件和可证明有效性算法
该研究开发了一种新的、能够实现概率混合共享潜在因素发现主题的算法,针对包含唯一新单词的共享潜在因素的主题模型,利用几何分析实现了高效计算和分布式数据挖掘应用。
- 贝叶斯回归的随机投影
该研究论文探讨随机投影作为贝叶斯回归分析的数据降维技术,证明了高维分布在数据点从 n 到 k 时仍可以得到保留,通过对投影数据进行高斯似然函数的评估获得的结果误差很小,结果表明该方法能够高效恢复回归模型。
- 通过矩阵分解实现张量分解
本研究提出了一种新的 CP 张量分解方法,使用了随机投影算法降低了问题难度并在模拟和真实数据集上得到了更好的表现。
- ICLR利用随机索引进行语言识别
使用随机投影和随机向量生成较为简单的随机索引,分析其在语言识别中的应用,证明其在 21 门不同语言识别中取得了 97.8% 的高精度。
- 使用松弛度的随机嵌入和高维近似最近邻
本文提出了一种针对欧氏空间的新的 “低质量” 嵌入定义,并应用随机投影将问题降低到与目标空间中近似最近邻的 $k$ 个近似最近邻象限所对应的原像空间的维度成反比的空间中;通过 BBD 树等数据结构,可有效检索这 $k$ 个近似最近邻点。在计 - 如何将核方法扩展到与深度神经网络一样好
通过基于随机投影导出的特征近似核函数,提出了有效地克服核方法计算复杂度的方法,并在图像识别和语音识别等大规模学习问题上成功地比较了核方法和深度神经网络的性能,同时克服了模型调节的困难。
- ROP: 通过秩一投影进行矩阵恢复
本文介绍了一种针对低秩矩阵恢复的秩 - 1 投影模型并提出了一种受约束的核范数最小化方法,该方法能够适应不同秩的矩阵并对细微扰动具有强鲁棒性,同时通过引入上下界对其精度进行了数学证明。此外,该方法对解决其他相关的统计问题具有启示作用。最后, - 随机投影的编码
本文研究了随机投影方法下的编码策略对算法表现的影响,发现在相似性度量和线性分类器训练任务中,均匀量化编码比现有方法更优,而在实际应用中,非均匀 2 位编码也表现较好。
- ICML随机投影后是否保留了边距?
本文分析随机投影后的距离边界失真,给出二进制分类问题保留边界的条件,并扩展分析到多类分类问题,提供了关于投影数据上多类边界的理论界限。
- 几乎最优的无限制快速 Johnson-Lindenstrauss 变换
利用 Banach 空间中的概率新工具,将随机投影问题的研究推进到一个新的水平。其主要结果是可以线性映射任意 $N$ 个 $n$ 维实向量到一个 $O (log N polylog (n))$ 线性空间中,并在保持向量之间距离一定畸变的同时 - RIP 下的正交匹配追踪稀疏恢复
本文解析了正交匹配追踪算法,表明只需要 O (k̅ln d) 个随机投影,即可恢复一 k̅- 疏松信号的 2 - 范数,从而对于压缩感知应用,该方法比之前的方法所需的随机投影数量 O (k̅²ln d) 更小。