深度神经网络对数字病理学中常见损伤的健壮性基准测试
数字病理学中的深度学习为病理分析带来了智能和自动化的显著提升,然而,组织准备到幻灯片成像的多个步骤引入了各种图像损坏,使得深度神经网络模型难以在临床诊断中获得稳定的诊断结果。为了评估和进一步增强模型的鲁棒性,我们分析了病理生命周期中全栈损坏的物理原因,并提出了一种名为 OmniCE 的全覆盖损坏仿真方法,以再现用 5 个级别的严重性量化的 21 种损坏。我们构建了三个在补丁级别和幻灯片级别上由 OmniCE 损坏的基准数据集,并评估了流行的深度神经网络在分类和分割任务中的鲁棒性。此外,我们研究了使用 OmniCE 损坏的数据集作为训练和实验的增强数据,以验证模型的泛化能力得到了显著提升。
Oct, 2023
该文章为图像分类器的稳健性建立了严格的基准测试,并提出了两个基准测试 ImageNet-C 和 ImageNet-P,用于评估分类器对常见扰动和干扰的稳健性。研究发现,从 AlexNet 分类器到 ResNet 分类器,相对污染鲁棒性几乎没有变化,而绕过的对抗性防御提供了实质性的常见干扰强度。
Mar, 2019
本文针对计算机视觉模型在实际应用中面临的常规污染问题进行了全面和系统的综述,介绍了不同类型的图像污染以及相关的评估指标和基准数据集,并对现有模型的基础污染鲁棒性进行了评估,以帮助选择适合特定计算机视觉任务的骨干网络。
May, 2023
本研究探讨了图像分类器对以文字为导向的失真的鲁棒性,并利用扩散模型对图像进行不同域的编辑,研究结果表明: 在不同语言为基础的失真和编辑域中,图像分类器的性能显著下降,卷积模型比变压器架构更为鲁棒,同时,常见的数据扩充技术可以提高原始数据和编辑图像的性能。
Apr, 2023
本研究的目的是针对 DeepLabv3+ 模型在语义分割应用中的鲁棒性进行全面调查,研究结果显示性能与鲁棒性有很大关系,而有些架构属性则对鲁棒性产生了显著影响。
Aug, 2019
我们创建并开源了基于 MedMNIST + 收藏的 12 个数据集和 9 种成像模式的基准数据集 MedMNIST-C,模拟了不同严重程度的任务和模式特定图像损坏以全面评估已建立算法对真实世界工件和分布偏移的鲁棒性,并提供定量证据表明我们简单易用的人工损坏方法可用于提高模型的鲁棒性。与传统的通用增强策略不同,我们的方法利用领域知识,在与广泛采用的方法相比时表现出更高的鲁棒性。通过引入 MedMNIST-C 并开源相应的库以实现有针对性的数据增强,我们为医学成像领域越来越具有挑战的鲁棒方法的发展做出贡献。代码可在此 https URL github.com/francescodisalvo05/medmnistc-api 找到。
Jun, 2024
本研究旨在建立一个全面、严谨、连贯的标准来评估对抗性鲁棒性,通过两个鲁棒性曲线作为公正的评估标准来进行大规模实验,全面掌握攻击与防御方法的表现并得出重要结论和未来研究的启示。
Dec, 2019
本文提出了深度神经网络在 3D 点云数据上应用于安全关键领域,但对其鲁棒性的研究较少。作者提出了新的用于测试冲突鲁棒性的基准数据集,并给出了一种简单而有效的方法来降低现有模型在此数据集上的表现差距。作者通过实验发现了一些有关点云识别中鲁棒性的关键见解,例如在适当的训练下,基于 Transformer 的结构具有最强的鲁棒性。
Jan, 2022
本研究证明:大多数图像较差的基准测试不能很好地衡量图像识别模型在许多场景下的稳健性,因此提出了一种基于非监督在线适应的方法,通过更改模型激活的统计特征来提高模型的稳健性。改进后的模型可在 ImageNet-C 数据集上取得更好的表现。
Jun, 2020
本文探讨了模型参数的脆弱性对于模型鲁棒性和泛化性的重要性,并提出了通过参数损坏来衡量神经网络参数鲁棒性的指标,并给出了一种梯度下降的估算方法,以提高训练效率。我们的研究得到理论和实证的支持,发现了深度神经网络的脆弱性,并提出了一种敌对损坏抗性训练的方法,可以提高模型的鲁棒性和预测准确率。
Jun, 2020