持久图上的归一化瓶颈距离及其在维度降低下同调保持的应用
本文提出了一种新的基于黎曼几何的持久图远程度量方法,将持久图建模为在希尔伯特球上以平方根框架表示的 2D 概率密度函数,避免与点进行一一对应比较,优化了计算复杂度,并可运用差分几何进行持久图的统计学分析。
May, 2016
本文首次尝试以差分隐私为基础的拓扑数据分析,产生了近乎最优的私有持久性图。研究表明,使用 $L^1$-DTM 持久性图在灵敏度方面的表现更佳,并提出了使用指数机制进行隐私保护的方案。通过模拟和实验数据验证,证明了提出的隐私机制近乎最优的准确性。
May, 2023
本文探讨了将持久图嵌入到可分离的希尔伯特空间中的可能性,并证明了对于几种已有的无限维希尔伯特空间稳定嵌入方案,任意下限必须依赖于持久图的基数,而在有界基数限制下,即使将持久图限制为有界基数,寻找一个双唇函数嵌入也是不可能的。
Jun, 2018
本文研究了拓扑数据分析方法在分类和聚类任务中的应用,特别是通过使用持续图可以总结有关可能复杂和高维数据集形状的重要信息。我们探索了量子计算机用于估计持续图之间距离的潜力,提出了用于 Wasserstein 距离和 $d^{c}_{p}$ 距离的变分量子算法。我们的实现是量子近似优化算法的加权版本,依赖于控制子句来编码优化问题的约束条件。
Feb, 2024
在高维噪声的存在下,通过 $k$ 最近邻图上的谱距离,如扩散距离和有效电阻,可以使持久同调在检测正确拓扑结构方面具有鲁棒性。该研究还导出了有效电阻的新的闭式表达式,并描述了其与扩散距离的关系。最后,通过应用这些方法于几个高维单细胞 RNA 测序数据集,表明 $k$ 最近邻图上的谱距离可以稳健地检测细胞周期环。
Nov, 2023
通过将 PERSISTENCE DIAGRAM 转换为 PERSISTENCE IMAGE,可以提高 machine learning 任务中鉴别拓扑信息的能力。
Jul, 2015
研究了各种统计距离度量方法,提出了一种基于 Johnson-Lindenstrauss 引理的降维方法,可以实现任意低的失真度,并证明 Bhattacharyya 距离的嵌入具有任意低的加性误差。同时展示了 Bhattacharyya 和 Kullback-Leibler 距离的点集具有任意大的失真度,并提供了一个接近 Bhattacharyya 距离下限的嵌入方案。
Sep, 2009
在这项工作中,我们介绍了一类称为扩展拓扑伪距离(ETD)的伪距离,它具有可调节的复杂性,并且可以在高复杂性极端近似切片和经典的 Wasserstein 距离,同时在较低复杂性极端上与 Persistence Statistics 相似,在持续矢量化和 Wasserstein 距离之间插值。我们通过理论比较展示了如何适应我们的新距离来达到持续矢量化和 Wasserstein 距离的中间水平。我们还在实验中验证了 ETD 相对于准确性的优势,并在计算复杂度方面优于 PS、Wasserstein 和 Sliced Wasserstein 距离。
Feb, 2024