基因型分群漂移的基线标准
通过实验测试,我们对机器学习中的次群体转变机制和算法的泛化能力进行了深入分析,并提出了一种基于最差类准确率的简单选择标准,强调了最差组准确率和其他重要指标之间的基本权衡关系。
Feb, 2023
本研究评估了 204 个 ImageNet 模型在 213 个不同的测试条件下的表现,发现大多数当前技术无法提供对真实数据中分布变化的健壮性,唯一例外的是在较大且更多样化的数据集上进行训练可以在多种情况下提高健壮性,并且我们的研究表明当前真实数据中的分布变化是一个开放的问题。
Jul, 2020
本文通过利用多模态基础模型中的分布鲁棒性,通过参数微调来提高分布鲁棒性,并利用自然语言输入来消除图像特征中的偏见,从而在子群落变化下改善最坏情况性能。大量实证研究表明,通过自然语言进行去偏倚的图像表示能够显著提高性能,并降低在子群体变化下的性能不稳定性。
Feb, 2024
通过开发一系列针对神经网络参数的群组感知先验分布,本研究旨在改善机器学习模型在数据分布的子群体变化下的性能,从而在真实世界环境中实现安全部署,并且证明使用该先验进行训练可以获得最先进的性能,即使仅重新训练之前训练的模型的最后一层。群组感知先验简单易于理解,与现有方法,如属性伪标记和数据重新加权相辅相成,并为利用贝叶斯推理实现对子群体变化的稳健性打开了新的前景。
Mar, 2024
本研究提出了一种框架来分析各种分布转移,并通过评估 19 个不同类别的方法,提供了当前最先进方法的整体分析。结果显示,与标准 ERM 基线相比,预训练和数据扩充(学习或启发式)在许多情况下都具有很大的优势,但不能很好地适应不同的数据集和转移。
Oct, 2021
本文提出 COnfidence-baSed MOdel Selection(CosMoS)方法,基于模型置信度动态选择不同强度的模型来在多数和少数子群体上实现高性能,并使用多个数据集验证其性能。
Jun, 2023
通过研究核心属性 Z 的规模,我们开发了一种可伸缩且有原则的两阶段估计过程,可以评估最先进模型的稳健性,证明了我们的方法认证模型的稳健性,防止部署不可靠的模型。
Jul, 2024
本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型,使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集,通过估计数据漂移量建立了鲁棒性,并在多个基准数据集上进行了实验证明了该方法的重要性。
Aug, 2020
本文扩展了 Shifts 数据集,加入了两个来源于高风险工业应用的数据集,用于探索模型的鲁棒性和不确定性估计。新数据集包括 3D 磁共振脑图像中白质多发性硬化病变的分割和船舶功耗的估计,具有普遍分布转移和严格的安全要求。
Jun, 2022