一种基于分布的 Mapper 算法
本文介绍了优化 Mapper 图的覆盖参数的算法,该算法基于 G-means 聚类,并使用高斯混合模型选择适当的覆盖,实验证明该算法生成的 Mapper 图保留了数据集的本质。
Sep, 2023
本文介绍了基于 Web 框架的交互式分析和可视化高维点云数据的 Mapper Interactive 算法,该方法实现了映射算法的交互式、可扩展和可扩展性,支持实践数据分析和加速拓扑分析工作流程。
Nov, 2020
使用拓扑学工具进行无监督数据表示和可视化是拓扑数据分析和数据科学领域中一个活跃且快速发展的研究方向。本研究提出了一种优化方案,通过对 Mapper 图的筛选器进行参数调优,构建了更加优化的数据表示,其收敛性质也得到了研究。实验证明,该方法在多个数据集上优于任意其他表示方法。
Feb, 2024
本研究结合 Mapper 算法和 Graph Neural Networks,提出一种基于拓扑结构的图形可视化方法,通过 PageRank 算法等实现了有效的图池化处理,并在图分类基准测试上取得了竞争力结果。
Feb, 2020
本文研究了一维 Mapper 收敛于其连续模拟 - Reeb 图的统计性问题。我们证明了 Mapper 是 Reeb 图的最优估计器,其可以自动调整参数并计算其拓扑特征的置信区间。这可避免在 Mapper 的可视化、聚类和特征选择中使用大网格的参数测试和保留最稳定实践的问题。
Jun, 2017
使用代数拓扑的方法(TDA)来分析和侦测复杂的恶意软件模式,发现 TDA Mapper (结合 PCA) 在聚类和发现隐藏的恶意软件集群方面比 PCA 更好,持久图用于识别重叠的恶意软件集群。可以使用随机森林和决策树,以及 t-SNE 和持久图来应对噪声数据,提高恶意软件检测的性能和鲁棒性。
Nov, 2022
我们开发了一种通过最适合数据类型的过滤将持久图与数字数据关联起来的流程,使用网格搜索方法确定最佳表示方法和参数,并在常见基准数据集上比较不同的表示方法,这是利用持久同调和机器学习进行数据分类的简单易用的流程的第一步,同时为了解为什么在给定数据集和任务的情况下,一对(过滤,拓扑表示)优于另一对。
Sep, 2023
提出一种基于自主单元、分布式异步训练、电路驱动的权重更新方案以及启发式搜索的算法,使得拓扑特征图的训练在无需中央控制和同步执行的条件下实现,可进行可扩展的大规模数据集处理,同时实验结果表明算法在多个数据集上的分类任务中性能表现稳定。
Jan, 2023