介绍了一种分析高维分布差异的方法,即主要差异分析(PDA)。该方法通过找到最大化 Wasserstein 距离的投影来操作。引入了一种稀疏变体,以识别造成差异的特征。提供了原始极小化问题和其半定松弛的算法。还展示了该方法如何应用于单细胞 RNA-seq 中的不同细胞类型的差异识别。广义框架超越了特定选择的 Wasserstein 距离。
Oct, 2015
通过提出新的聚类特征和一种基于空间密度和概率方法的聚类算法,本研究在广泛的数据集上展示出较其他先进的基于密度的聚类方法更好的性能。
Oct, 2023
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时,本文讨论了与统计优化输运相关的一些研究方向。
Jul, 2019
该论文介绍了一种新的方法,使用少量参数化正交投影来近似分解高维分布的一维边际分布,以便于在生成式框架中实现深度学习。研究表明,该方法在标准图像综合基准和高分辨率图像和视频生成方面表现出优越性和最先进性。
Apr, 2019
本研究介绍了基于深度学习的一种小批量近似方法,用于在自动编码器和生成式对抗网络等现代生成模型中实现切片 Wasserstein 距离,以便在无监督情况下实现高分辨率图像和视频的生成,表现为当代最佳水平。
Jun, 2017
利用 Wasserstein 距离进行数据集简化,通过嵌入合成数据到预训练分类模型的特征空间进行分布匹配,实现了数据集简化的新的最先进性能。
Nov, 2023
本文提出了一种基于 Wasserstein 度量的分布化空间中的实例分类方法,其中包括使用 k 最近邻算法、k 均值聚类和伪混合建模等基于距离的分类算法。通过最大化 Fisher 比例的原则,通过迭代算法在向量空间中进行比例最大化来实现此方法,以增强分类性能,并证明其优于操作基于分布数据的向量表示的已建立算法。
May, 2024
本文提出了一种基于任务特定决策边界和 Wasserstein 度量的领域自适应的特征分布对齐方法,即切片 Wasserstein 差异。实验表明该方法在数字和标志识别、图像分类、语义分割和目标检测上都具有有效性和普适性。
Mar, 2019
使用本地 PCA 算法估计嵌入的欧几里得空间中光滑紧致亚流形的维数和正切空间需要的样本点数具有数学严格的上界,该估计考虑了非均匀数据分布和可能跨越亚流形变化的噪声,并允许在多个点上同时进行估计。
Oct, 2021
本篇论文介绍了一种基于调和均值的线性判别分析方法 -- 多类别判别分析,用于图像分类以及多标签的降维。实验结果表明,MCDA 在分类准确率、宏 F1 score 和微 F1 score 等方面优于其他单标签和多标签方法。
Oct, 2016