利用缺失数据进行结构学习的最优传输
本研究使用最优传输距离量化了两个随机数据集共享相同分布的假设,并将其转化为缺失数据值的损失函数。我们提出了使用端到端学习最小化这些损失的实用方法,并在 MCAR,MAR 和 MNAR 设置中使用 UCI 存储库中的数据集对我们的方法进行了评估。这些实验表明,即使缺失值的百分比很高,在 OT-based 方法在缺失数据方面与最先进的缺失数据值的整合方法相匹配或优于之前的结果。
Feb, 2020
使用最优传输的方法实现了一个面向许多有向图的参数学习框架,可以灵活地从不完整数据中推断概率有向图模型中的潜在变量。在多个实验中,该方法展示了恢复真实参数和离散表示学习等任务上的优异性能。
May, 2023
本文提出一个非线性广义离散最优传输模型,可应用于领域自适应和自然语言处理中,同时探索其快速算法和相关属性。Illustrative experiments 展示了模型引导的结构耦合的好处。
Dec, 2017
本文章提出了一种新的方法来估计高维中两个概率分布之间的 Wasserstein 距离和最优传输方案,该方法可以在各种任务中获得显著的改进,包括单细胞 RNA 测序数据的领域适应性。该方法基于低运输秩的耦合,解决了数据驱动最优传输中的维数灾难,并得到了理论分析的支持。
Jun, 2018
通过基于熵正则化最优输运的新方法和 Gromov-Wasserstein 距离概念,实现并优化了联合聚类的算法,可以自动地确定行和列聚类的数量,并在广泛的实验评估中展示了其快速和准确的功能。
May, 2017
本研究使用最优传递(OT)来研究从数据中学习因果结构的问题,提供了一种基于下三角单调参数传输映射的约束方法来设计对噪声分布无偏置的条件独立性检验,还提供了一种可以处理潜在变量的因果发现算法,并使用一种新方法来定义分数,与现有技术进行了实验结果比较。
May, 2023
我们介绍了一种利用最优输运理论进行条件独立性约束下数据修复的框架,并将该问题转化为正则化的优化问题,提出了一种受 Sinkhorn 算法启发的迭代算法来解决高维大规模数据的计算问题。通过广泛的实验,我们证明了该方法在实际数据清洗和预处理任务中的高效性和实用性,同时与传统方法进行了比较,突出了我们的技术在保持数据效用和确保所需条件独立性约束方面的优越性。
Mar, 2024
本文提出了一种基于推向前映射和学习适当代价结构的方法,通过使用 Monge-Bregman-Occam 管线,使用 $h$- 变换和 $h$- 凹潜力生成适应结构化代价的基本真实传输,并提出一种学习低维空间中传输位移的正则化方法,通过 Riemannian 梯度下降对 Stiefel 流形进行基础变化,从而得到更加稳健和易于解释的估计量。
Jun, 2023