ICMLFeb, 2021

扩散地球移动距离与分配嵌入

TL;DR本文提出了一种计算大规模相关高维数据集之间的距离的快速方法,称为扩散地球移位距离(Diffusion Earth Mover's Distance)。通过建模数据集为分布并计算相互作用矩阵来实现,该方法的时间复杂度为 O (n),并且比基于树的算法更加准确和可微分,适用于深度神经网络等梯度下降框架。实验通过 210 个 COVID-19 样本的单细胞数据表明该方法比同等精确度的方法至少快两个数量级,且可以嵌入更高层次的患者流形中揭示患者间的结构和异质性,并可适用于其他医学和生物模型中大规模数据集的距离计算。