最优输运用于缺失数据填充

Feb, 2020

Missing Data Imputation using Optimal Transport

Boris Muzellec, Julie Josse, Claire Boyer, Marco Cuturi

TL;DR本研究使用最优传输距离量化了两个随机数据集共享相同分布的假设，并将其转化为缺失数据值的损失函数。我们提出了使用端到端学习最小化这些损失的实用方法，并在 MCAR，MAR 和 MNAR 设置中使用 UCI 存储库中的数据集对我们的方法进行了评估。这些实验表明，即使缺失值的百分比很高，在 OT-based 方法在缺失数据方面与最先进的缺失数据值的整合方法相匹配或优于之前的结果。

Abstract

missing data is a crucial issue when applying machine learning algorithms to real-world datasets. Starting from the simple assumption that two batches extracted randomly from the same dataset should share the sam

missing data machine learning algorithms optimal transport distances imputation uci repository

发现论文，激发创造

利用缺失数据进行结构学习的最优传输

使用基于最优传输的打分算法，从缺失数据中学习因果结构，通过广泛的模拟和实验，论文证明了该方法在各种模拟和真实数据实验中比基线更有效地恢复了真实的因果图。

Feb, 2024

小批量最优输运距离；分析与应用

本文提出了一种基于小批量优化技术的最优传输距离计算方法，探讨了该方法的优点和局限，并提出了一种去偏置的小批量最优传输距离函数，并在机器学习中的各种应用中验证了该方法的实用性。

Jan, 2021

不平衡小批量最优输运；领域适应应用

本文讨论了一种使用非均衡最优传输距离结合小批量策略的方法，以在处理大规模数据集时对比一般的优化传输距离更加鲁棒且能够获得更好的实验结果。

Mar, 2021

机器学习中的最优传输近期进展

本研究综述了 Optimal Transport 在机器学习中的应用，特别关注于监督、无监督、迁移和强化学习领域，并重点介绍了计算 Optimal Transport 的最新发展及其与机器学习实践的相互作用。

Jun, 2023

机器学习中的最优传输综述：大数据时代的地球运动员

本文讨论了在机器学习中优化传输（Optimal Transport）的应用，侧重于可扩展性问题，并提供了优化传输问题的全面综述。作者提出了现有文献中用于解决优化传输可扩展性问题的方法，并对这些方法进行了系统分析，并提出了未来研究方向和挑战。

May, 2023

通过最优传输表征超出分布误差

提出了一种新的利用最优传输理论来估计模型在无标签 out-of-distribution 数据上表现的方法，该方法称为置信度最优传输（COT），并且通过引入阈值处理的方法 Confidence Optimal Transport with Thresholding（COTT），可进一步提高精度。在各种标准基准测试中，实验表明 COT 和 COTT 优于现有的最先进方法，预测误差降低了高达 3 倍。

May, 2023

通过逆最优输运学习匹配

本文提出了一种基于反向最优传输的统一数据驱动框架，可从噪声和不完整的实证匹配矩阵中学习自适应、非线性交互成本函数并在各种匹配环境下预测新的匹配。

Feb, 2018

OTMatch：以最优传输方式改进半监督学习

本文介绍了一种新的方法 OTMatch，通过使用最优输运损失函数，利用类别之间的语义关系，提高半监督学习的性能。与现有最先进的方法 FreeMatch 相比，在 CIFAR-10、STL-10 和 ImageNet 数据集上分别实现了 3.18%、3.46% 和 1.28% 的错误率降低，证明了我们方法在半监督学习中利用语义关系提升学习性能的有效性和优越性。

Oct, 2023

MM-Align: 基于最优输运的对齐动力学学习，以实现快速准确推断缺失模态序列

本文介绍一种名为 MM-Align 的新方法，利用最优传输理论中的对齐动力学学习模块和去噪训练算法，针对缺失多模态数据进行推断。通过在覆盖两个多模态任务的三个数据集上进行全面实验，结果表明我们的方法可以在各种缺失条件下执行更精确和更快的推断，并减轻过度拟合问题。

Oct, 2022

元学习用于最优输运的无监督异常检测

本文提出了一种利用元学习自动化检测离群点的新方法，该方法利用最优输运从以前的离群点数据集中提取最佳离群点检测技术，并且我们发现该方法在非监督离群点检测中表现优异，该方法也可以轻松推广到其他非监督设置。

Nov, 2022