在存在异常值的情况下,本文研究了异常值稀疏 Wasserstein Barycenter 问题,并提出了基于聚类的 LP 方法和 coreset 技术,实现了高精度逼近和高效率。
Apr, 2024
本文提出一种新的方法来解决多层次聚类问题,该方法旨在同时将数据在每个组中分区,并在潜在的大型分层结构数据集中发现组间的分组模式。我们的方法涉及到多个离散概率测度空间上的联合优化方案,这些测度空间具有 Wasserstein 距离度量。通过利用与 Wasserstein barycenter 问题的联系,我们提出了该问题的许多变体,这些变体可以采用快速的优化算法。本文还建立了局部和全局聚类估计的一致性性质。最后,使用合成和真实数据展示了所提出方法的灵活性和可扩展性。
Jun, 2017
开发了一种基于 Inexact Proximal point 方法的算法 (IPOT),该算法通过将投影用于概率单纯形来近似评估近端算子,以解决精确最优输运问题,并具有具有理论保证和强健的正则化参数选择,同时缓解了数值稳定性问题并避免了应用于生成模型时的收缩问题。此外,基于 IPOT 提出了一种新的算法,用于获得更锐利的 Wasserstein 重心。
Feb, 2018
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时,本文讨论了与统计优化输运相关的一些研究方向。
Jul, 2019
通过利用测度集中现象,我们基于高维随机向量的一维投影近似 Sliced-Wasserstein 距离,避免了通常需要的蒙特卡罗模拟,这一方法简单精确,用于生成模型问题效果显著。
Jun, 2021
通过开发一种改进的 Bregman ADMM 方法来计算大型聚类的近似离散 Wasserstein 质心,实现了较高的精度和较低的计算成本,实验证明方法的计算效率和聚类结果都具有高竞争力。
Sep, 2015
通过找到一种优化非线性映射,将数据降维到一维后计算 Wasserstein 距离,本文提供了 KMS p-Wasserstein 距离的尖锐有限样本保证,并给出了计算 KMS 2-Wasserstein 距离的难度和仿真实验的表现。
May, 2024
本文提出了一种基于持续同调和最优传输理论的新型计算实用的拓扑聚类方法,通过计算与节点连接部件和环相关联的持久条形码的 Wasserstein 距离和重心,对具有复杂拓扑结构的网络进行聚类,并在保留不同网络之间的节点对应关系的同时聚合网络。在模拟网络和测量功能脑网络上验证了该方法的有效性。
Nov, 2021
本文提出两种算法来计算一组经验概率测度的 Wasserstein barycenters,其中包括使用 entropic 正则化来平滑 Wasserstein distance 的方法,并使用矩阵缩放算法计算其梯度,这些算法可用于可视化大量图像并解决约束聚类问题。
Oct, 2013
本文提出了一种新的统计模型 —— 尖峰运输模型,该模型规范化了两个概率分布仅在低维子空间上不同的假设。我们研究了在这个模型下 Wasserstein 距离的最小二乘率,并表明这种低维结构可以避免维度灾难。通过最小二乘分析,我们得出了一个下界,表明在缺少这样的结构的情况下,插值估计量在高维度中几乎是最优的。我们还提供了统计和计算难度之间的差距的证据,并猜测任何计算上有效的估计量注定受到维数灾难的影响。
Sep, 2019