本文提出一种新的方法来解决多层次聚类问题,该方法旨在同时将数据在每个组中分区,并在潜在的大型分层结构数据集中发现组间的分组模式。我们的方法涉及到多个离散概率测度空间上的联合优化方案,这些测度空间具有 Wasserstein 距离度量。通过利用与 Wasserstein barycenter 问题的联系,我们提出了该问题的许多变体,这些变体可以采用快速的优化算法。本文还建立了局部和全局聚类估计的一致性性质。最后,使用合成和真实数据展示了所提出方法的灵活性和可扩展性。
Jun, 2017
Wasserstein 判别分析是一种新的有监督方法,可以通过计算适当的线性映射到较低维子空间来提高高维数据的分类性能。
Aug, 2016
本文提出了一种基于持续同调和最优传输理论的新型计算实用的拓扑聚类方法,通过计算与节点连接部件和环相关联的持久条形码的 Wasserstein 距离和重心,对具有复杂拓扑结构的网络进行聚类,并在保留不同网络之间的节点对应关系的同时聚合网络。在模拟网络和测量功能脑网络上验证了该方法的有效性。
Nov, 2021
通过开发一种改进的 Bregman ADMM 方法来计算大型聚类的近似离散 Wasserstein 质心,实现了较高的精度和较低的计算成本,实验证明方法的计算效率和聚类结果都具有高竞争力。
Sep, 2015
我们提出了一个基于谱聚类和分布相似度度量(如最大均值差异和 Wasserstein 距离)的简单而有效的框架用于离散分布聚类,并通过使用线性最优输运在大规模数据集上高效地构建相似矩阵,得到了较高的聚类准确率和计算效率。
Jan, 2024
本文提出一种基于最优输运的聚类方法,它通过使用变分原理求解最优输运,并研究使用力图来将任意域聚合为固定数量的聚类。通过迭代地将聚类中心驱动到目标域中,并通过调整力图来保持最小聚类能量,从而同时追求聚类和聚类中心与目标域之间的 Wasserstein 距离。作者在合成和真实数据的领域自适应、重新网格化和表示学习方面演示了该方法的应用。
Jun, 2018
我们介绍一个计算分布之间 Wasserstein 距离的方法,该方法是以分布式的方式进行计算的。我们利用 Wasserstein 距离的几何特性,尤其是三角不等式,和相关的测地线,通过操作并交换测地线空间中的分布来逐步近似 Wasserstein 距离。我们不仅验证了 FedWad 的收敛性质,还通过构建新的分布式模型和提升流行的联邦学习算法的性能来提供了实证结果。
Oct, 2023
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时,本文讨论了与统计优化输运相关的一些研究方向。
Jul, 2019
使用 Wasserstein 距离对分布进行差分私密密度估计,并设计了可以适应简单实例的实例最优算法,对于特殊情况下的离散分布,结果还导致了 TV 距离下的实例最优私密学习。
Jun, 2024
本研究研究了广义密度聚类,提出了两种数据基础方法来选择波宽,并研究了密度聚类的稳定性,表明一种简单的基于图的算法可以成功地近似高密度聚类。
Jul, 2009