基于度量相似性学习的最优传输域泛化

Jul, 2020

基于度量相似性学习的最优传输域泛化

Domain Generalization via Optimal Transport with Metric Similarity Learning

Fan Zhou, Zhuqing Jiang, Changjian Shui, Boyu Wang, Brahim Chaib-draa

TL;DR我们提出了一种基于优化输运的机器学习方法，该方法不仅提取不变特征，而且在提取特征时还限制了标签相似性，以实现跨多个领域的分类。实验结果表明，该方法优于大部分基线方法，各组件的消融研究也证明了方法的有效性。

Abstract

Generalizing knowledge to unseen domains, where data and labels are unavailable, is crucial for machine learning models. We tackle the domain generalization problem to learn from multiple source domains and generalize to a target domain with unknown statistics. The crucial idea is to extract the underlying →

domain generalization invariant features label similarity optimal transport adversarial training

发现论文，激发创造

度量学习增强的生物化学回归域自适应最优输运

本文提出使用最优传输算法（OT）进行表示对齐，解决生物医学应用中的连续标签回归任务问题。通过提出新的测度域距离和引入后验方差正则化的方法，进一步为拓展任务提供了支持。此外，提出了将 OT 与度量学习相结合的方法，通过动态层次三重损失函数来描述全局数据分布，试验证明该方法在未监督和半监督学习任务的小分子和材料晶体数据上显著优于现有方法。

Feb, 2022

最优传输理论分析的领域自适应

本文在探讨域自适应的过程中，提出了一种使用 Wasserstein 度量作为两个数据集分布差异度量的方法，并且通过对多个不同的学习场景的实验证明了这种方法的通用性，同时进一步探讨了这种方法可能比其他现有框架更紧密的原因。

Oct, 2016

通过最优传输对一个模型在未知领域的测试性能进行评估

利用仅在测试时可用的信息（如模型参数、训练数据或其统计信息以及未标记的测试数据），我们提出了一种基于最优输运的测度，与机器学习模型在未知领域的性能高度相关，并且高效可计算。通过对常用基准数据集及其损坏数据进行广泛的经验评估，证明了我们的测度在估计模型在各种实际应用中的性能方面的效用，包括选择源数据和架构以获得最佳未知领域数据性能的问题，以及在测试时预测已部署模型在未知领域的性能的问题。我们的经验结果表明，我们的测度综合使用源领域和未知领域的信息，与模型的性能高度相关，在相关性方面显著优于仅使用未知领域数据计算的流行预测熵测度。

May, 2024

领域自适应的最优传输

该研究提出了一种规范化的非监督最优运输模型，通过找到公共表示来在源域和目标域之间执行两个领域的对齐，从而在标记和未标记的数据中同时利用了源和目标领域中的信息，该模型在可视化自适应方面表现优异。

Jul, 2015

通过最优传输计算几何数据集之间的距离

本文提出了一种基于最优传输理论的数据集距离度量方法，不依赖于具体模型参数及训练数据，能够更好地比较数据集的相似度，与转移学习难度具有很好的相关性。

Feb, 2020

目标偏移下的多源域自适应最优传输

本文提出了一种基于最优传输的多源域自适应方法解决目标移位下的分类问题，实验结果表明相比现有技术在卫星图像分割任务上具有较好的性能。

Mar, 2018

领域泛化中的可迁移性量化和提升

本研究通过定义和计算可量化的可迁移性来研究这种特征，在领域泛化中，我们将其与诸如总变化和 Wasserstein 距离之类的区别和联系，发现现有算法中很少具有可迁移性，随后提出了一种新的算法，以测试各种基准数据集，并在其中实现了持续的改进。

Jun, 2021

通过高斯混合模型进行域适应的最优输运

通过最优传输探索领域适应的研究，提出了一种新颖的方法，通过高斯混合模型对数据分布进行建模，从而解决连续最优传输问题。实验结果表明该方法在故障诊断的领域适应基准上具有最先进的性能。

Mar, 2024

基于 Wasserstein 分布鲁棒优化的类别条件域泛化

本文介绍一种基于分布鲁棒优化的分类器，在 Wasserstein 球内最优化条件分布的最坏情况下，增强条件分布领域泛化的鲁棒性，并利用迭代算法自动学习 Wasserstein 球半径，实验表明该方法比传统领域泛化方法在未知目标领域中表现更好。

Sep, 2021

学习生成用于域泛化的新领域

本文主要探讨如何通过数据生成器来增加多个源域的多样性提高领域泛化能力，在使用了最优传输的分布偏差模型和循环一致性和分类损失的数据生成器模型中，我们的 L2A-OT（学习通过最优传输增广）方法在四个基准数据集中表现优于当前最先进的 DG 方法。

Jul, 2020