通过将课程设置为任务分布之间的插值,将生成课程作为约束优化传输问题来提高课程强化学习(CRL)方法的性能,从而在具有不同特点的各种任务中取得高性能。
Sep, 2023
使用最优传输的方法实现了一个面向许多有向图的参数学习框架,可以灵活地从不完整数据中推断概率有向图模型中的潜在变量。在多个实验中,该方法展示了恢复真实参数和离散表示学习等任务上的优异性能。
May, 2023
本研究综述了 Optimal Transport 在机器学习中的应用,特别关注于监督、无监督、迁移和强化学习领域,并重点介绍了计算 Optimal Transport 的最新发展及其与机器学习实践的相互作用。
Jun, 2023
通过使用凸凹成本函数的最优传输,我们提出了一个新颖的概念框架来检测异常值,并在自动异常值矫正机制中进行了集成和优化,实验证明了我们方法在众多模拟和实证分析中对均值估计、最小绝对回归和期权隐含波动率曲面拟合的有效性和优越性。
Mar, 2024
本文研究了机器学习分类器对抗样本(躲避攻击)的鲁棒性,使用最优传输来表征在这一场景下可能的最小损失。作者应用该框架研究了高斯数据的情况,并探究了鲁棒性训练神经网络在 MNIST、Fashion MNIST 和 CIFAR-10 数据集上的最优分类性能与实际性能间的差距。
Sep, 2019
利用熵正则化最优传输技术作为深度强化学习网络中的一层,以实现更快速的学习并在端到端训练期间强制执行分配约束和规定,从而对于解决组合优化问题的效率进行优化。
Mar, 2022
该论文提出了一种基于最优输送的个性化联邦学习方案(FedOT),该方案利用最优输送映射将数据点转换到公共分布,并在应用传输映射时学习预测模型,可有效解决联邦学习中异构数据分布的问题。
Jun, 2022
本研究提出了一种基于最优传输成本不确定性集的安全强化学习框架,通过离线学习实现效率高、理论支持强的无需对数据收集过程进行过多假设的具有鲁棒性、安全性能的表现。在真实世界的强化学习套件中证明了该方法的优越性。
Jan, 2023
使用多边际最优传输距离的替代方法,实现了在 OT 意义下多个和多样化状态轨迹的组合,提供了更合理的演示几何平均值,从而使代理从多个专家中学习,并在 OpenAI Gym 控制环境中进行了效率分析,表明标准方法并不总是最优的。
Jul, 2023
通过将最优输运理论融入 Q-learning 框架,本文提出一种风险敏感的 Q-learning 算法来增强智能体的安全性,以期在优化策略的期望回报的同时,最小化策略的稳态分布与预先定义的风险分布之间的 Wasserstein 距离,从而减少访问危险状态的频率并比传统的 Q-learning 算法更快地趋于稳定的策略。
Jun, 2024