元学习用于最优输运的无监督异常检测
本研究综述了 Optimal Transport 在机器学习中的应用,特别关注于监督、无监督、迁移和强化学习领域,并重点介绍了计算 Optimal Transport 的最新发展及其与机器学习实践的相互作用。
Jun, 2023
通过使用凸凹成本函数的最优传输,我们提出了一个新颖的概念框架来检测异常值,并在自动异常值矫正机制中进行了集成和优化,实验证明了我们方法在众多模拟和实证分析中对均值估计、最小绝对回归和期权隐含波动率曲面拟合的有效性和优越性。
Mar, 2024
本研究介绍了在 MetaDL Challenge 2020 中排名第二的基于元学习的方法,在少量标注数据的情况下,通过修改隐空间中每个类别的分布来更好地对齐高斯分布,并利用期望最大化算法进一步对齐类别中心,使用 Sinkhorn 算法的最优传输映射。实验证明,该方法优于先前的研究以及使用 KNN 算法、高斯混合模型等其他算法的变体。
Feb, 2021
本文提出一个非线性广义离散最优传输模型,可应用于领域自适应和自然语言处理中,同时探索其快速算法和相关属性。Illustrative experiments 展示了模型引导的结构耦合的好处。
Dec, 2017
本文提出使用最优传输算法(OT)进行表示对齐,解决生物医学应用中的连续标签回归任务问题。通过提出新的测度域距离和引入后验方差正则化的方法,进一步为拓展任务提供了支持。此外,提出了将 OT 与度量学习相结合的方法,通过动态层次三重损失函数来描述全局数据分布,试验证明该方法在未监督和半监督学习任务的小分子和材料晶体数据上显著优于现有方法。
Feb, 2022
本文提出了一种基于最优传输理论的数据集距离度量方法,不依赖于具体模型参数及训练数据,能够更好地比较数据集的相似度,与转移学习难度具有很好的相关性。
Feb, 2020
本研究使用最优传输距离量化了两个随机数据集共享相同分布的假设,并将其转化为缺失数据值的损失函数。我们提出了使用端到端学习最小化这些损失的实用方法,并在 MCAR,MAR 和 MNAR 设置中使用 UCI 存储库中的数据集对我们的方法进行了评估。这些实验表明,即使缺失值的百分比很高,在 OT-based 方法在缺失数据方面与最先进的缺失数据值的整合方法相匹配或优于之前的结果。
Feb, 2020
该研究提出了一种新的元学习方法,通过使用从未标记的输入数据集生成的元特征,识别出适当的无监督异常检测算法。该方法的性能优于现有的解决方案,并使用超过 10000 个数据集进行了混合模型统计分析,结果表明相对较少的元特征就足以识别合适的无监督异常检测算法,但在元学习器中选择元模型具有相当大的影响。
Apr, 2023
本文介绍了一种新的方法 OTMatch,通过使用最优输运损失函数,利用类别之间的语义关系,提高半监督学习的性能。与现有最先进的方法 FreeMatch 相比,在 CIFAR-10、STL-10 和 ImageNet 数据集上分别实现了 3.18%、3.46% 和 1.28% 的错误率降低,证明了我们方法在半监督学习中利用语义关系提升学习性能的有效性和优越性。
Oct, 2023
通过将度量空间从欧氏距离度量更改为测地距离度量,将先前的最优传输模型扩展到内在表示的领域自适应问题,并通过引入簇先验结构构建了一个隐式贝叶斯模型来提高数据的鲁棒性。
Apr, 2023