基因型分群漂移的基线标准

Aug, 2020

BREEDS: Benchmarks for Subpopulation Shift

Shibani Santurkar, Dimitris Tsipras, Aleksander Madry

TL;DR本文提出一种方法，通过控制数据次群体的训练和测试集来实现对模型对子群体变化的鲁棒性进行评估和测试，并在 ImageNet 数据集上得到了验证。

Abstract

We develop a methodology for assessing the robustness of models to subpopulation shift---specifically, their ability to generalize to novel data subpopulations that were not observed during training. Our approach leverages the class structure underlying existing datasets to control the

model robustness subpopulation shift generalization dataset shifts imagenet

发现论文，激发创造

变化十分困难：分析亚群体转变

通过实验测试，我们对机器学习中的次群体转变机制和算法的泛化能力进行了深入分析，并提出了一种基于最差类准确率的简单选择标准，强调了最差组准确率和其他重要指标之间的基本权衡关系。

Feb, 2023

图像分类模型自然分布偏移鲁棒性测量

本研究评估了 204 个 ImageNet 模型在 213 个不同的测试条件下的表现，发现大多数当前技术无法提供对真实数据中分布变化的健壮性，唯一例外的是在较大且更多样化的数据集上进行训练可以在多种情况下提高健壮性，并且我们的研究表明当前真实数据中的分布变化是一个开放的问题。

Jul, 2020

跨模态去偏倚：利用语言减轻图像中的亚种群转变

本文通过利用多模态基础模型中的分布鲁棒性，通过参数微调来提高分布鲁棒性，并利用自然语言输入来消除图像特征中的偏见，从而在子群落变化下改善最坏情况性能。大量实证研究表明，通过自然语言进行去偏倚的图像表示能够显著提高性能，并降低在子群体变化下的性能不稳定性。

Feb, 2024

基准测试低数据量下对自然分布变化的鲁棒性

本文研究了不同低样本情况下，自然分布偏移的鲁棒性，发现没有单一模型比其他模型更鲁棒，同时现有的干预手段在某些数据集上可能无法提高鲁棒性。

Apr, 2023

注意 GAP：通过组感知先验改善对亚群体转变的鲁棒性

通过开发一系列针对神经网络参数的群组感知先验分布，本研究旨在改善机器学习模型在数据分布的子群体变化下的性能，从而在真实世界环境中实现安全部署，并且证明使用该先验进行训练可以获得最先进的性能，即使仅重新训练之前训练的模型的最后一层。群组感知先验简单易于理解，与现有方法，如属性伪标记和数据重新加权相辅相成，并为利用贝叶斯推理实现对子群体变化的稳健性打开了新的前景。

Mar, 2024

分布偏移的细粒度分析

本研究提出了一种框架来分析各种分布转移，并通过评估 19 个不同类别的方法，提供了当前最先进方法的整体分析。结果显示，与标准 ERM 基线相比，预训练和数据扩充（学习或启发式）在许多情况下都具有很大的优势，但不能很好地适应不同的数据集和转移。

Oct, 2021

基于置信度的模型选择：何时为子集群转移采取捷径

本文提出 COnfidence-baSed MOdel Selection（CosMoS）方法，基于模型置信度动态选择不同强度的模型来在多数和少数子群体上实现高性能，并使用多个数据集验证其性能。

Jun, 2023

评估最坏情况下子群体下的模型性能

通过研究核心属性 Z 的规模，我们开发了一种可伸缩且有原则的两阶段估计过程，可以评估最先进模型的稳健性，证明了我们的方法认证模型的稳健性，防止部署不可靠的模型。

Jul, 2024

稳健验证：即使分布发生偏移，也能自信地做出预测

本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型，使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集，通过估计数据漂移量建立了鲁棒性，并在多个基准数据集上进行了实验证明了该方法的重要性。

Aug, 2020

Shifts 2.0：扩展实际分布漂移数据集

本文扩展了 Shifts 数据集，加入了两个来源于高风险工业应用的数据集，用于探索模型的鲁棒性和不确定性估计。新数据集包括 3D 磁共振脑图像中白质多发性硬化病变的分割和船舶功耗的估计，具有普遍分布转移和严格的安全要求。

Jun, 2022