多分布学习的分布相关速率

Dec, 2023

Distribution-Dependent Rates for Multi-Distribution Learning

Rafael Hanashiro, Patrick Jaillet

TL;DR为了应对敏感机器学习应用中的不确定性建模需求，分布鲁棒优化（DRO）的设置在各种任务中寻求统一的良好性能。最近的多分布学习（MDL）框架以与环境的动态互动的方式解决了这一目标，在该框架中，学习者可以对每个目标分布进行采样访问。借鉴了纯探索多臂赌博机领域的观点，我们在 MDL 体制下提供了依赖于分布的保证，并且在与现有的分布无关分析相比，这种保证随着次优性差距的缩小而产生了优秀的样本大小依赖性。我们研究了两种非自适应策略：均匀探索和非均匀探索，并使用经验过程理论中的新工具提供了非渐进性后悔上界。此外，我们设计了一种自适应乐观算法 LCB-DR，展示了对差距的增强依赖性，类似于多臂赌博机文献中均匀分配和乐观分配之间的对比。

Abstract

To address the needs of modeling uncertainty in sensitive machine learning applications, the setup of distributionally robust optimization (DRO) seeks good performance uniformly across a variety of tasks. The recent mul

distributionally robust optimization multi-distribution learning pure-exploration multi-armed bandits regret bounds adaptive optimistic algorithm

发现论文，激发创造

通过分布式稳健优化实现统一性能学习模型

本研究提出了一种分布鲁棒的随机优化框架，利用凸形式化来解决学习模型受到数据生成分布扰动的问题，并通过多项收敛性保准来证明模型的可靠性，同时也得出了极限定理及有关泛化到未知人群、精细化认知等真实任务的证据。

Oct, 2018

基于数据驱动的分布鲁棒优化最优成本选择

提供了一种自然的数据驱动方式，用于学习分布绝对稳健优化问题中定义的分布区间，证明该框架包括自适应正则化作为一个特殊案例，实证表明所提出的方法能够改进广泛应用的机器学习估计器。

May, 2017

将未标记数据纳入分布鲁棒学习中

本研究介绍了一种新的分布鲁棒学习方法，该方法通过加入无标签数据以限制敌手从指定分布中选择数据，可以有效地进行分类，并提出了一个分布鲁棒的版本，可应用于主动学习。在 14 个真实数据集上的结果表明，该算法往往在传统方法无法提供良好结果的情况下表现出色。

Dec, 2019

分布鲁棒优化中第二玩家建模

本文提出了一种基于神经生成模型的分布鲁棒优化 (DRO) 方法，通过对不确定集合中的分布进行建模，使得模型在不确定的分布中表现优异，并提出一种 KL 约束内部最大化目标的松弛优化方式，通过大规模生成模型的梯度优化来解决相应的实现和优化挑战，并且开发模型选择启发式方法来指导超参数搜索。实验结果表明提出的方法比当前基线模型更具鲁棒性。

Mar, 2021

多分布最优学习

多分布学习中的自适应采样算法解决了最坏情况风险最小化问题，并提供了样本复杂度的最优解，同时证明了随机化的必要性。

Dec, 2023

基于组合优化的大规模分布式鲁棒模型学习

本文提出通过有限和复合优化来提供可扩展的机器学习算法，用于训练鲁棒性强的模型，并展示本算法在超大数据集上学习鲁棒模型的有效性。

Mar, 2022

分布鲁棒优化：一篇综述

本文概述了分布鲁棒优化（DRO）的主要概念和贡献，以及它与鲁棒优化、风险规避、机会约束优化和函数正则化的关系。

Aug, 2019

基于分布鲁棒的强化学习基础探讨

鉴于训练和部署之间环境变化的需求，我们对分布稳健强化学习（DRRL）的理论基础做出贡献。通过一个以分布稳健马尔可夫决策过程（DRMDPs）为核心的综合建模框架，我们严谨地构建了适用于决策者和对手的各种建模属性。此外，我们还研究了对手引起的偏移的灵活性，并检验了动态规划原理的存在条件。从算法的角度来看，动态规划原理的存在具有重要意义，因为大多数现有的数据和计算效率强化学习算法依赖于该原理。我们提供了从统一方法论出发的简化证明以及不存在全面广义动态规划原理的场景的反例。

Nov, 2023

全局 - 局部正则化的分布鲁棒性

本文提出一种基于 Wasserstein 的分布鲁棒性优化方法，旨在通过同时应用本地和全局正则化，将原始分布与最具挑战性的分布相结合，提高模型的建模能力，解决深度神经网络在实际应用中对抗性示例和分布偏移等问题。实验结果表明，该方法在半监督学习、领域适应、领域泛化和对抗机器学习等各领域中均明显优于现有的正则化方法。

Mar, 2022

强化学习中的分布鲁棒性和正则化

本文介绍了一种新的 Wasserstein 分布强化学习框架，并将其与正则化相联系，从而为解决强化学习中的外部不确定性问题提供一个新的实用工具。

Mar, 2020