利用缺失数据进行结构学习的最优传输

Feb, 2024

利用缺失数据进行结构学习的最优传输

Optimal Transport for Structure Learning Under Missing Data

Vy Vo, He Zhao, Trung Le, Edwin V. Bonilla, Dinh Phung

TL;DR使用基于最优传输的打分算法，从缺失数据中学习因果结构，通过广泛的模拟和实验，论文证明了该方法在各种模拟和真实数据实验中比基线更有效地恢复了真实的因果图。

Abstract

causal discovery in the presence of missing data introduces a chicken-and-egg dilemma. While the goal is to recover the true causal structure, robust →

causal discovery missing data imputation optimal transport structure learning

发现论文，激发创造

最优输运用于缺失数据填充

本研究使用最优传输距离量化了两个随机数据集共享相同分布的假设，并将其转化为缺失数据值的损失函数。我们提出了使用端到端学习最小化这些损失的实用方法，并在 MCAR，MAR 和 MNAR 设置中使用 UCI 存储库中的数据集对我们的方法进行了评估。这些实验表明，即使缺失值的百分比很高，在 OT-based 方法在缺失数据方面与最先进的缺失数据值的整合方法相匹配或优于之前的结果。

Feb, 2020

使用最优传输学习有向图模型

使用最优传输的方法实现了一个面向许多有向图的参数学习框架，可以灵活地从不完整数据中推断概率有向图模型中的潜在变量。在多个实验中，该方法展示了恢复真实参数和离散表示学习等任务上的优异性能。

May, 2023

结构化最优输运

本文提出一个非线性广义离散最优传输模型，可应用于领域自适应和自然语言处理中，同时探索其快速算法和相关属性。Illustrative experiments 展示了模型引导的结构耦合的好处。

Dec, 2017

基于因子耦合的统计最优输运

本文章提出了一种新的方法来估计高维中两个概率分布之间的 Wasserstein 距离和最优传输方案，该方法可以在各种任务中获得显著的改进，包括单细胞 RNA 测序数据的领域适应性。该方法基于低运输秩的耦合，解决了数据驱动最优传输中的维数灾难，并得到了理论分析的支持。

Jun, 2018

通过逆最优输运学习匹配

本文提出了一种基于反向最优传输的统一数据驱动框架，可从噪声和不完整的实证匹配矩阵中学习自适应、非线性交互成本函数并在各种匹配环境下预测新的匹配。

Feb, 2018

最优传输的共聚类

通过基于熵正则化最优输运的新方法和 Gromov-Wasserstein 距离概念，实现并优化了联合聚类的算法，可以自动地确定行和列聚类的数量，并在广泛的实验评估中展示了其快速和准确的功能。

May, 2017

通过单调三角输运映射学习因果图

本研究使用最优传递（OT）来研究从数据中学习因果结构的问题，提供了一种基于下三角单调参数传输映射的约束方法来设计对噪声分布无偏置的条件独立性检验，还提供了一种可以处理潜在变量的因果发现算法，并使用一种新方法来定义分数，与现有技术进行了实验结果比较。

May, 2023

OTClean: 条件独立性违反数据清洗的最优输运方法

我们介绍了一种利用最优输运理论进行条件独立性约束下数据修复的框架，并将该问题转化为正则化的优化问题，提出了一种受 Sinkhorn 算法启发的迭代算法来解决高维大规模数据的计算问题。通过广泛的实验，我们证明了该方法在实际数据清洗和预处理任务中的高效性和实用性，同时与传统方法进行了比较，突出了我们的技术在保持数据效用和确保所需条件独立性约束方面的优越性。

Mar, 2024

基于蒙特序列的结构性位移学习成本

本文提出了一种基于推向前映射和学习适当代价结构的方法，通过使用 Monge-Bregman-Occam 管线，使用 $h$- 变换和 $h$- 凹潜力生成适应结构化代价的基本真实传输，并提出一种学习低维空间中传输位移的正则化方法，通过 Riemannian 梯度下降对 Stiefel 流形进行基础变化，从而得到更加稳健和易于解释的估计量。

Jun, 2023

通过最优输运量化分布模型风险

本文提出了一种方法来计算特定概率模型下利益期望，并给出了为不同的概率模型设置偏差范围的基于最优输运的度量方法，同时应用于风险分析。

Apr, 2016