基于度量相似性学习的最优传输域泛化
本文提出使用最优传输算法(OT)进行表示对齐,解决生物医学应用中的连续标签回归任务问题。通过提出新的测度域距离和引入后验方差正则化的方法,进一步为拓展任务提供了支持。此外,提出了将 OT 与度量学习相结合的方法,通过动态层次三重损失函数来描述全局数据分布,试验证明该方法在未监督和半监督学习任务的小分子和材料晶体数据上显著优于现有方法。
Feb, 2022
本文在探讨域自适应的过程中,提出了一种使用 Wasserstein 度量作为两个数据集分布差异度量的方法,并且通过对多个不同的学习场景的实验证明了这种方法的通用性,同时进一步探讨了这种方法可能比其他现有框架更紧密的原因。
Oct, 2016
利用仅在测试时可用的信息(如模型参数、训练数据或其统计信息以及未标记的测试数据),我们提出了一种基于最优输运的测度,与机器学习模型在未知领域的性能高度相关,并且高效可计算。通过对常用基准数据集及其损坏数据进行广泛的经验评估,证明了我们的测度在估计模型在各种实际应用中的性能方面的效用,包括选择源数据和架构以获得最佳未知领域数据性能的问题,以及在测试时预测已部署模型在未知领域的性能的问题。我们的经验结果表明,我们的测度综合使用源领域和未知领域的信息,与模型的性能高度相关,在相关性方面显著优于仅使用未知领域数据计算的流行预测熵测度。
May, 2024
该研究提出了一种规范化的非监督最优运输模型,通过找到公共表示来在源域和目标域之间执行两个领域的对齐,从而在标记和未标记的数据中同时利用了源和目标领域中的信息,该模型在可视化自适应方面表现优异。
Jul, 2015
本文提出了一种基于最优传输理论的数据集距离度量方法,不依赖于具体模型参数及训练数据,能够更好地比较数据集的相似度,与转移学习难度具有很好的相关性。
Feb, 2020
本研究通过定义和计算可量化的可迁移性来研究这种特征,在领域泛化中,我们将其与诸如总变化和 Wasserstein 距离之类的区别和联系,发现现有算法中很少具有可迁移性,随后提出了一种新的算法,以测试各种基准数据集,并在其中实现了持续的改进。
Jun, 2021
通过最优传输探索领域适应的研究,提出了一种新颖的方法,通过高斯混合模型对数据分布进行建模,从而解决连续最优传输问题。实验结果表明该方法在故障诊断的领域适应基准上具有最先进的性能。
Mar, 2024
本文介绍一种基于分布鲁棒优化的分类器,在 Wasserstein 球内最优化条件分布的最坏情况下,增强条件分布领域泛化的鲁棒性,并利用迭代算法自动学习 Wasserstein 球半径,实验表明该方法比传统领域泛化方法在未知目标领域中表现更好。
Sep, 2021
本文主要探讨如何通过数据生成器来增加多个源域的多样性提高领域泛化能力,在使用了最优传输的分布偏差模型和循环一致性和分类损失的数据生成器模型中,我们的 L2A-OT(学习通过最优传输增广)方法在四个基准数据集中表现优于当前最先进的 DG 方法。
Jul, 2020