潜变量混合的分布鲁棒损失

Jul, 2020

Distributionally Robust Losses for Latent Covariate Mixtures

John Duchi, Tatsunori Hashimoto, Hongseok Namkoong

TL;DR该研究使用凸优化方法控制给定大小的所有子人群的最坏情况表现，从而提高模型的泛化能力。实证研究表明该方法可在未知子人群中推广。

Abstract

While modern large-scale datasets often consist of heterogeneous subpopulations -- for example, multiple demographic groups or multiple text corpora -- the standard practice of minimizing average loss fails to guarantee uniformly low losses across all subpopulations. We propose a conve

large-scale datasets heterogeneous subpopulations worst-case performance finite-sample convergence guarantees model generalization

发现论文，激发创造

评估最坏情况下子群体下的模型性能

通过研究核心属性 Z 的规模，我们开发了一种可伸缩且有原则的两阶段估计过程，可以评估最先进模型的稳健性，证明了我们的方法认证模型的稳健性，防止部署不可靠的模型。

Jul, 2024

通过分布式稳健优化实现统一性能学习模型

本研究提出了一种分布鲁棒的随机优化框架，利用凸形式化来解决学习模型受到数据生成分布扰动的问题，并通过多项收敛性保准来证明模型的可靠性，同时也得出了极限定理及有关泛化到未知人群、精细化认知等真实任务的证据。

Oct, 2018

分布鲁棒性的瞬间

在分布鲁棒学习中，我们引入了基于对抗性矩违规的新的极小极大目标，并展示了通过最小化该目标等效于最小化与真实条件期望的最坏情况下的 $l_2$ 距离，从而在计算成本上提供了大体量的经验性节省。

May, 2024

多组鲁棒性

通过设计健壮的学习算法以克服任意和无差别的数据损坏，我们提出了一种多群健壮算法，其对每个亚群体的健壮性仅随该亚群体内的数据损坏量而降低。当数据损坏在亚群体中分布不均匀时，我们的算法提供比标准保证更有意义的健壮性保证，这些标准保证对数据损坏和受影响亚群体的关系视而不见。我们的技术在多群公平性和健壮性之间建立了新的联系。

May, 2024

稳健对数损失分类的公平性

采用最坏情况下的对数损失最小化方法将公平性标准纳入分布鲁棒性的第一原则，并基于此原则推导出一种新的分类器，该方法具有凸性和渐近收敛性，并在三个基准公平数据集上展示了其实践优势。

Mar, 2019

凹对准合融合方法在子群分析中的应用

该论文提出了一种基于回归模型的受惩罚子组分析方法，该方法利用惩罚来划分不同子组，通过对被观察截距的差异进行配对惩罚来刻画异质性，并且该方法经过了统计检验的验证。

Aug, 2015

基于重复损失最小化的公平性无需人口统计信息

通过采用分布式鲁棒优化的方法，我们可以在不考虑特定群体身份的情况下控制少数群体的风险水平，从而避免了现有的经验风险最小化方法在时间推移中导致的表征偏差加剧。在一个真实的文本自动完成任务中，这种方法提高了少数群体用户的满意度。

Jun, 2018

分布鲁棒优化的大规模方法

该文主要研究了基于 CVaR 和 chi-squared 分布的鲁棒优化问题，并提出了一种新的算法以及相应的优化方案。研究结果表明，该算法不仅适用于大规模应用，而且在实验中的效率比全样本方法高 9~36 倍。

Oct, 2020

数据增强最后一层训练方法的理论保证

通过线性最后一层重新训练和数据增强，我们针对每个子人群将潜在表示（输入到最后一层的数据）的分布建模为高斯分布，以实现在训练数据的许多不同子人群之间确保公平预测，并达到最优的最差组准确性。我们对合成数据和大型公开数据集进行了评估和验证。

May, 2024

广义线性问题的可扩展近似

本文讨论了随机优化中的种群风险以及解决大规模问题中经验风险计算的困难，提出了一种基于随机梯度下降算法的解决方案，以 OLS 估计器为基础进行最小化种群风险的近似。

Nov, 2016