稳健性的多重面貌:对于越界泛化的关键分析
本研究评估了 204 个 ImageNet 模型在 213 个不同的测试条件下的表现,发现大多数当前技术无法提供对真实数据中分布变化的健壮性,唯一例外的是在较大且更多样化的数据集上进行训练可以在多种情况下提高健壮性,并且我们的研究表明当前真实数据中的分布变化是一个开放的问题。
Jul, 2020
本研究提出了一种框架来分析各种分布转移,并通过评估 19 个不同类别的方法,提供了当前最先进方法的整体分析。结果显示,与标准 ERM 基线相比,预训练和数据扩充(学习或启发式)在许多情况下都具有很大的优势,但不能很好地适应不同的数据集和转移。
Oct, 2021
计算机视觉中,通过数据增强方式可以提高鲁棒性,但增加高斯数据增强和对抗训练等方法并不能保证所有的污染类型都能同样得到提高,因此需要使用更多样的数据增强方式来缓解这些折衷。最近提出的 AutoAugment 方法在清晰精度和鲁棒性方面均得到了最佳表现。
Jun, 2019
人工智能应用越来越受到公众的关注,然而研究者在计算机视觉模型的理论假设与实际部署时面临一种被称为分布偏移的困境。本文讨论了识别这一突出差距的重要原因,探索了分布偏移的概念及其关键意义,并对数据中心领域用于解决这些问题的技术进行了深入概述。
Dec, 2023
对现代深度卷积网络(CNN)未能在分布漂移下推广的问题进行了研究,并探究了预备数据量、模型规模和数据处理流程对迁移性能的影响,发现增加训练集和模型大小显著提高了分布偏移鲁棒性,同时是非常简单的预处理,如修改图像分辨率在某些情况下可以显著缓解鲁棒性问题。最后,我们提出了一个新的综合数据集 SI-Score 进行了系统的分析。
Jul, 2020
本研究探讨了基于域一般化的经验和认证鲁棒性之间的相互影响,并发现两种鲁棒性均适用于未知的数据域。同时我们也证明,在医学应用中,对抗性增强显著提高了鲁棒性的泛化能力,对数据准确性影响不大。
Sep, 2022
通过评估 39 种数据增强类型对广泛使用的 OOD 数据集的影响,证明了每种数据增强对模型对 OOD 数据的鲁棒性的影响,并进一步证明了所述假设不成立;形状偏差的增加不一定导致更高的 OOD 鲁棒性。通过分析结果,还发现 ImageNet-1K 数据集中的一些偏差可以通过适当的数据增强来减小。我们的评估结果进一步表明,域内准确性和 OOD 鲁棒性之间不一定存在权衡,选择适当的增强方法可以同时提高域内准确性和 OOD 鲁棒性。
Jun, 2024
本研究探讨计算机视觉模型对分布变化的脆弱性,并通过组合优化问题和标准搜索算法寻求这些模型容易受到哪些图像转换的影响。我们通过新的数据增强方法,根据模型容易受到影响的图像变换来训练更加强健模型。实证评估表明,所设计的算法对保持图像内容的操作和分布变化等可以相对更强健。
Mar, 2019
计算机视觉应用中,现有的稳健性基准测试依赖于对数字图像的扰动,从而偏离了图像获取过程中发生的分布转变。为了弥合这一差距,我们引入了一个新的分布转变数据集 ImageNet-ES,该数据集由一个真实相机在一个可控实验环境中直接捕获的 202k 张图像组成。通过这个新数据集,我们评估了超出分布范围 (Out-of-Distribution, OOD) 检测和模型稳健性。我们发现,现有的 OOD 检测方法无法应对 ImageNet-ES 中的协变量转变,这意味着应重新审视 OOD 的定义和检测,以适应真实世界的分布变化。我们还观察到,通过学习环境和传感器的变化,模型在 ImageNet-C 和 - ES 方面都更加稳健,这是在现有数字增强的基础上的补充。最后,我们的结果表明,通过相机传感器控制有效地减轻转变可以显著提高性能,而无需增加模型大小。通过这些发现,我们的基准测试可能有助于未来关于计算机视觉稳健性、OOD 和相机传感器控制的研究。我们的代码和数据集可在此 https URL 找到。
Apr, 2024