深度神经网络对数字病理学中常见损伤的健壮性基准测试

Jun, 2022

深度神经网络对数字病理学中常见损伤的健壮性基准测试

Benchmarking the Robustness of Deep Neural Networks to Common Corruptions in Digital Pathology

Yunlong Zhang, Yuxuan Sun, Honglin Li, Sunyi Zheng, Chenglu Zhu...

TL;DR本文为评估深度神经网络在受损病理图像上的表现建立了易于使用的基准，发现了多种深度神经网络模型存在显著的精度下降和不可靠的置信度评估，并提出了一种用于将验证集替换为该基准集的新方法。

Abstract

When designing a diagnostic model for a clinical application, it is crucial to guarantee the robustness of the model with respect to a wide range of image corruptions. Herein, an easy-to-use benchmark is established to evaluate how →

diagnostic model deep neural networks pathology images corruption confidence estimation

发现论文，激发创造

数字病理学中使用错误模拟评估和增强深度学习模型的鲁棒性

数字病理学中的深度学习为病理分析带来了智能和自动化的显著提升，然而，组织准备到幻灯片成像的多个步骤引入了各种图像损坏，使得深度神经网络模型难以在临床诊断中获得稳定的诊断结果。为了评估和进一步增强模型的鲁棒性，我们分析了病理生命周期中全栈损坏的物理原因，并提出了一种名为 OmniCE 的全覆盖损坏仿真方法，以再现用 5 个级别的严重性量化的 21 种损坏。我们构建了三个在补丁级别和幻灯片级别上由 OmniCE 损坏的基准数据集，并评估了流行的深度神经网络在分类和分割任务中的鲁棒性。此外，我们研究了使用 OmniCE 损坏的数据集作为训练和实验的增强数据，以验证模型的泛化能力得到了显著提升。

Oct, 2023

评估神经网络对普遍损坏和扰动的鲁棒性能力

该文章为图像分类器的稳健性建立了严格的基准测试，并提出了两个基准测试 ImageNet-C 和 ImageNet-P，用于评估分类器对常见扰动和干扰的稳健性。研究发现，从 AlexNet 分类器到 ResNet 分类器，相对污染鲁棒性几乎没有变化，而绕过的对抗性防御提供了实质性的常见干扰强度。

Mar, 2019

计算机视觉模型对常见失真的鲁棒性：一项调查研究

本文针对计算机视觉模型在实际应用中面临的常规污染问题进行了全面和系统的综述，介绍了不同类型的图像污染以及相关的评估指标和基准数据集，并对现有模型的基础污染鲁棒性进行了评估，以帮助选择适合特定计算机视觉任务的骨干网络。

May, 2023

基于文本引导的鲁棒性基准测试

本研究探讨了图像分类器对以文字为导向的失真的鲁棒性，并利用扩散模型对图像进行不同域的编辑，研究结果表明：在不同语言为基础的失真和编辑域中，图像分类器的性能显著下降，卷积模型比变压器架构更为鲁棒，同时，常见的数据扩充技术可以提高原始数据和编辑图像的性能。

Apr, 2023

对语义分割模型鲁棒性的基准测试

本研究的目的是针对 DeepLabv3+ 模型在语义分割应用中的鲁棒性进行全面调查，研究结果显示性能与鲁棒性有很大关系，而有些架构属性则对鲁棒性产生了显著影响。

Aug, 2019

MedMNIST-C: 通过模拟真实图像损坏的全面基准和改进的分类器鲁棒性

我们创建并开源了基于 MedMNIST + 收藏的 12 个数据集和 9 种成像模式的基准数据集 MedMNIST-C，模拟了不同严重程度的任务和模式特定图像损坏以全面评估已建立算法对真实世界工件和分布偏移的鲁棒性，并提供定量证据表明我们简单易用的人工损坏方法可用于提高模型的鲁棒性。与传统的通用增强策略不同，我们的方法利用领域知识，在与广泛采用的方法相比时表现出更高的鲁棒性。通过引入 MedMNIST-C 并开源相应的库以实现有针对性的数据增强，我们为医学成像领域越来越具有挑战的鲁棒方法的发展做出贡献。代码可在此 https URL github.com/francescodisalvo05/medmnistc-api 找到。

Jun, 2024

对抗鲁棒性基准测试

本研究旨在建立一个全面、严谨、连贯的标准来评估对抗性鲁棒性，通过两个鲁棒性曲线作为公正的评估标准来进行大规模实验，全面掌握攻击与防御方法的表现并得出重要结论和未来研究的启示。

Dec, 2019

针对常见污染物的 3D 点云识别鲁棒性基准测试

本文提出了深度神经网络在 3D 点云数据上应用于安全关键领域，但对其鲁棒性的研究较少。作者提出了新的用于测试冲突鲁棒性的基准数据集，并给出了一种简单而有效的方法来降低现有模型在此数据集上的表现差距。作者通过实验发现了一些有关点云识别中鲁棒性的关键见解，例如在适当的训练下，基于 Transformer 的结构具有最强的鲁棒性。

Jan, 2022

通过协变量转移适应性提高对常见数据损坏的稳健性

本研究证明：大多数图像较差的基准测试不能很好地衡量图像识别模型在许多场景下的稳健性，因此提出了一种基于非监督在线适应的方法，通过更改模型激活的统计特征来提高模型的稳健性。改进后的模型可在 ImageNet-C 数据集上取得更好的表现。

Jun, 2020

探索深度神经网络的漏洞：参数破坏研究

本文探讨了模型参数的脆弱性对于模型鲁棒性和泛化性的重要性，并提出了通过参数损坏来衡量神经网络参数鲁棒性的指标，并给出了一种梯度下降的估算方法，以提高训练效率。我们的研究得到理论和实证的支持，发现了深度神经网络的脆弱性，并提出了一种敌对损坏抗性训练的方法，可以提高模型的鲁棒性和预测准确率。

Jun, 2020