元学习用于最优输运的无监督异常检测

Nov, 2022

元学习用于最优输运的无监督异常检测

Meta-Learning for Unsupervised Outlier Detection with Optimal Transport

Prabhant Singh, Joaquin Vanschoren

TL;DR本文提出了一种利用元学习自动化检测离群点的新方法，该方法利用最优输运从以前的离群点数据集中提取最佳离群点检测技术，并且我们发现该方法在非监督离群点检测中表现优异，该方法也可以轻松推广到其他非监督设置。

Abstract

automated machine learning has been widely researched and adopted in the field of supervised classification and regression, but progress in unsupervised settings has been limited. We propose a novel approach to automate outlier detection based on →

automated machine learning outlier detection meta-learning optimal transport unsupervised learning

发现论文，激发创造

机器学习中的最优传输近期进展

本研究综述了 Optimal Transport 在机器学习中的应用，特别关注于监督、无监督、迁移和强化学习领域，并重点介绍了计算 Optimal Transport 的最新发展及其与机器学习实践的相互作用。

Jun, 2023

基于最优输运的自动异常数据矫正

通过使用凸凹成本函数的最优传输，我们提出了一个新颖的概念框架来检测异常值，并在自动异常值矫正机制中进行了集成和优化，实验证明了我们方法在众多模拟和实证分析中对均值估计、最小绝对回归和期权隐含波动率曲面拟合的有效性和优越性。

Mar, 2024

基于迁移学习的少样本分类：利用预处理过的骨干神经网络潜空间进行最优输运映射

本研究介绍了在 MetaDL Challenge 2020 中排名第二的基于元学习的方法，在少量标注数据的情况下，通过修改隐空间中每个类别的分布来更好地对齐高斯分布，并利用期望最大化算法进一步对齐类别中心，使用 Sinkhorn 算法的最优传输映射。实验证明，该方法优于先前的研究以及使用 KNN 算法、高斯混合模型等其他算法的变体。

Feb, 2021

结构化最优输运

本文提出一个非线性广义离散最优传输模型，可应用于领域自适应和自然语言处理中，同时探索其快速算法和相关属性。Illustrative experiments 展示了模型引导的结构耦合的好处。

Dec, 2017

度量学习增强的生物化学回归域自适应最优输运

本文提出使用最优传输算法（OT）进行表示对齐，解决生物医学应用中的连续标签回归任务问题。通过提出新的测度域距离和引入后验方差正则化的方法，进一步为拓展任务提供了支持。此外，提出了将 OT 与度量学习相结合的方法，通过动态层次三重损失函数来描述全局数据分布，试验证明该方法在未监督和半监督学习任务的小分子和材料晶体数据上显著优于现有方法。

Feb, 2022

通过最优传输计算几何数据集之间的距离

本文提出了一种基于最优传输理论的数据集距离度量方法，不依赖于具体模型参数及训练数据，能够更好地比较数据集的相似度，与转移学习难度具有很好的相关性。

Feb, 2020

最优输运用于缺失数据填充

本研究使用最优传输距离量化了两个随机数据集共享相同分布的假设，并将其转化为缺失数据值的损失函数。我们提出了使用端到端学习最小化这些损失的实用方法，并在 MCAR，MAR 和 MNAR 设置中使用 UCI 存储库中的数据集对我们的方法进行了评估。这些实验表明，即使缺失值的百分比很高，在 OT-based 方法在缺失数据方面与最先进的缺失数据值的整合方法相匹配或优于之前的结果。

Feb, 2020

构建无监督异常检测的元学习器

该研究提出了一种新的元学习方法，通过使用从未标记的输入数据集生成的元特征，识别出适当的无监督异常检测算法。该方法的性能优于现有的解决方案，并使用超过 10000 个数据集进行了混合模型统计分析，结果表明相对较少的元特征就足以识别合适的无监督异常检测算法，但在元学习器中选择元模型具有相当大的影响。

Apr, 2023

OTMatch：以最优传输方式改进半监督学习

本文介绍了一种新的方法 OTMatch，通过使用最优输运损失函数，利用类别之间的语义关系，提高半监督学习的性能。与现有最先进的方法 FreeMatch 相比，在 CIFAR-10、STL-10 和 ImageNet 数据集上分别实现了 3.18%、3.46% 和 1.28% 的错误率降低，证明了我们方法在半监督学习中利用语义关系提升学习性能的有效性和优越性。

Oct, 2023

隐式贝叶斯自适应：一种协同传输方法

通过将度量空间从欧氏距离度量更改为测地距离度量，将先前的最优传输模型扩展到内在表示的领域自适应问题，并通过引入簇先验结构构建了一个隐式贝叶斯模型来提高数据的鲁棒性。

Apr, 2023