通过最优传输计算几何数据集之间的距离
我们提出了一种基于优化输运的机器学习方法,该方法不仅提取不变特征,而且在提取特征时还限制了标签相似性,以实现跨多个领域的分类。实验结果表明,该方法优于大部分基线方法,各组件的消融研究也证明了方法的有效性。
Jul, 2020
该论文介绍了基于分布和话题建模的层次最优输运方法作为文档之间的元距离,以量化文档之间的相似性。这种方法具有解释性和可扩展性,并在 k-NN 分类方面表现良好。
Jun, 2019
本文提出一个非线性广义离散最优传输模型,可应用于领域自适应和自然语言处理中,同时探索其快速算法和相关属性。Illustrative experiments 展示了模型引导的结构耦合的好处。
Dec, 2017
该论文讨论了 Optimal Transport 在不同空间中的运用,尤其是研究了如何在图形和结构化数据之间定义和应用 Optimal Transport,特别是在这些数据属于不可比较空间时如何完成适应操作。该文提出了一组 Optimal Transport 工具,其中包括对 Gromov-Wasserstein 距离的研究,其性质可以定义不同空间中的有趣运输问题。我们分析了各种工具的数学性质,建立了计算它们的算法解决方案,并研究了它在许多机器学习场景中的适用性,其中包括分类和简化、结构数据分区以及异构域适应。
Nov, 2020
该论文提出了一种在潜在的全局转换情况下进行离散最优传输的通用框架,并通过采用灵活类的不变性来选择转换进行联合最优化求解,成功解决了包括无监督词汇翻译基准在内的各种任务。
Jun, 2018
通过将度量空间从欧氏距离度量更改为测地距离度量,将先前的最优传输模型扩展到内在表示的领域自适应问题,并通过引入簇先验结构构建了一个隐式贝叶斯模型来提高数据的鲁棒性。
Apr, 2023
本研究提出了一种基于批量样本的优化传输规划的学习重要性驱动的距离计量方式,与端到端深层度量学习相结合,可以自动强调困难的样本,加速收敛率并获得更好的视觉识别表现,实验证明方法优于现有 3D 形状识别技术。
Mar, 2019
本文提出使用最优传输算法(OT)进行表示对齐,解决生物医学应用中的连续标签回归任务问题。通过提出新的测度域距离和引入后验方差正则化的方法,进一步为拓展任务提供了支持。此外,提出了将 OT 与度量学习相结合的方法,通过动态层次三重损失函数来描述全局数据分布,试验证明该方法在未监督和半监督学习任务的小分子和材料晶体数据上显著优于现有方法。
Feb, 2022
该研究提出了一个基于最优传输与聚类结构相结合的层级对齐方法,同时采用 ADMM 算法和 Sinkhorn 距离来提高噪声、模糊或多峰数据的对齐精度,并在合成数据和神经信号解码中进行了应用,表明该方法对于具有一致聚类结构的数据集在跨领域对齐方面具有显著的性能改进作用。
Jun, 2019