纠错学习的最优传输

Apr, 2023

Optimal Transport for Correctional Learning

Rebecka Winqvist, Inês Lourenco, Francesco Quinzan, Cristian R. Rojas, Bo Wahlberg

TL;DR本文介绍了一种广义的纠正学习方法，在优化输运的框架下，利用一个专家代理来改善学习代理的参数估计，该方法可以估计更复杂的特征，并考虑了多个干预策略。

Abstract

The contribution of this paper is a generalized formulation of correctional learning using optimal transport, which is about how to optimally transport one mass distribution to another. correctional learning is a

correctional learning optimal transport teacher-student approach parameter estimation intervention policies

发现论文，激发创造

关于最优传输在课程强化学习中的益处

通过将课程设置为任务分布之间的插值，将生成课程作为约束优化传输问题来提高课程强化学习（CRL）方法的性能，从而在具有不同特点的各种任务中取得高性能。

Sep, 2023

使用最优传输学习有向图模型

使用最优传输的方法实现了一个面向许多有向图的参数学习框架，可以灵活地从不完整数据中推断概率有向图模型中的潜在变量。在多个实验中，该方法展示了恢复真实参数和离散表示学习等任务上的优异性能。

May, 2023

机器学习中的最优传输近期进展

本研究综述了 Optimal Transport 在机器学习中的应用，特别关注于监督、无监督、迁移和强化学习领域，并重点介绍了计算 Optimal Transport 的最新发展及其与机器学习实践的相互作用。

Jun, 2023

基于最优输运的自动异常数据矫正

通过使用凸凹成本函数的最优传输，我们提出了一个新颖的概念框架来检测异常值，并在自动异常值矫正机制中进行了集成和优化，实验证明了我们方法在众多模拟和实证分析中对均值估计、最小绝对回归和期权隐含波动率曲面拟合的有效性和优越性。

Mar, 2024

利用最优输运对对抗鲁棒性进行下界限制

本文研究了机器学习分类器对抗样本（躲避攻击）的鲁棒性，使用最优传输来表征在这一场景下可能的最小损失。作者应用该框架研究了高斯数据的情况，并探究了鲁棒性训练神经网络在 MNIST、Fashion MNIST 和 CIFAR-10 数据集上的最优分类性能与实际性能间的差距。

Sep, 2019

结合强化学习和最优传输的旅行商问题

利用熵正则化最优传输技术作为深度强化学习网络中的一层，以实现更快速的学习并在端到端训练期间强制执行分配约束和规定，从而对于解决组合优化问题的效率进行优化。

Mar, 2022

个性化联邦学习的最优输运方法

该论文提出了一种基于最优输送的个性化联邦学习方案（FedOT），该方案利用最优输送映射将数据点转换到公共分布，并在应用传输映射时学习预测模型，可有效解决联邦学习中异构数据分布的问题。

Jun, 2022

具有鲁棒性保障的安全增强学习的最优传输扰动

本研究提出了一种基于最优传输成本不确定性集的安全强化学习框架，通过离线学习实现效率高、理论支持强的无需对数据收集过程进行过多假设的具有鲁棒性、安全性能的表现。在真实世界的强化学习套件中证明了该方法的优越性。

Jan, 2023

关于通过最优转运在模仿学习中结合专家示范的研究

使用多边际最优传输距离的替代方法，实现了在 OT 意义下多个和多样化状态轨迹的组合，提供了更合理的演示几何平均值，从而使代理从多个专家中学习，并在 OpenAI Gym 控制环境中进行了效率分析，表明标准方法并不总是最优的。

Jul, 2023

最优传输辅助的风险敏感 Q-Learning

通过将最优输运理论融入 Q-learning 框架，本文提出一种风险敏感的 Q-learning 算法来增强智能体的安全性，以期在优化策略的期望回报的同时，最小化策略的稳态分布与预先定义的风险分布之间的 Wasserstein 距离，从而减少访问危险状态的频率并比传统的 Q-learning 算法更快地趋于稳定的策略。

Jun, 2024