- 基于符合预测的深度分类器的证据不确定性集合
利用证据一致性预测方法(ECP)为图像分类器生成一致性预测集,通过基于非一致性评分函数,利用目标标签的对数几率值推导出的证据计算非一致性评分函数的组成部分:一致性预测中的不确定性启发式概念、不确定性惊喜度和期望效用,实验评估结果证明,ECP - 基于贝叶斯优化和图文模型的图像分类器失效的高效探索
现实世界中应谨慎使用图像分类器,验证集上的性能可能不能反映出真实世界中的性能。尤其是对那些在训练过程中经常遇到的条件,分类器可能表现良好,但对其他不常见的条件可能表现不佳。我们假设最近在文本到图像生成模型方面的进展使其成为对计算机视觉模型( - 通过缩放定律和人机对齐研究来限制对抗鲁棒性
对于使图像分类器对微小扰动具有稳健性的问题,本文通过开发对抗训练的首个可扩展规律分析了模型大小、数据集大小和合成数据质量对稳健性的影响,并提出了对进一步推动该领域的可行建议。
- 发现和减轻图像分类器中的多个有偏群体
通过分解图像特征为多个组分并生成自然语言描述,使用 DIM 方法来发现和减轻图像分类器中的多个有偏群体,并揭示模型在 Hard ImageNet 上的失误模式,以理解图像分类器中的模型偏差。
- 可可植株中 CSSVD 检测的图像分类
基于 VGG16、ResNet50 和 Vision Transformer (ViT) 的图像分类器,在 KaraAgroAI Cocoa 数据集上进行了评估。我们的最佳图像分类器基于 ResNet50,在仅 20 个 epochs 的情 - 单图卷积足以:高效灰度图像分类
利用向量化图像视图的新型灰度(单通道)图像分类方法,通过批处理方式使用单个图卷积层,结合 FPGA 加速器进行优化,从而在各个特定领域的灰度图像分类数据集中实现更低的延迟(最高可降低 16 倍)和相当或引领性的性能。
- 对抗性样本在扩散模型流形中不一致
通过扩散模型检测和分析攻击引入的图像异常,结果表明攻击实例与扩散模型的学习流形不一致。
- 使用相互作用识别重要像素组
为了更好地理解图像分类器的行为,本研究提出了一种方法 MoXI(模型交互解释),该方法通过有效且准确地识别一组具有高预测置信度的像素,采用了博弈论的概念、Shapley 值和像素之间的相互影响,既考虑了个别像素的影响,又考虑了像素对模型置信 - 模型训练中的合成图像缩放定律…… 目前而言
通过研究最先进的文本到图像模型生成的合成图像在规模上的表现,本文发现合成图像在训练监督图像分类器时性能较差原因是某些概念无法被现成的文本到图像模型生成,但对于与真实图像结合训练 CLIP 模型或存在真实图像供给不足或评估数据集与训练数据差异 - MedISure:利用混合边界分析确保基于机器学习的医学图像分类器
通过合成测试数据和新颖的技术 Mix-Up Boundary Analysis (MUBA) 来评估图像分类器的预测公平性,旨在展示将传统的保证原则应用于评估机器学习模型以提升医疗技术的安全性和可靠性的重要性。
- 评估地面事实解释时要小心
评估图像分类器关于人类感知定义的地面真实标记(例如分割掩模)的解释,主要评估的是考虑中的模型的质量而不是解释方法自身。在这种观察的驱动下,我们提出了一个框架,用于联合评估将深度神经网络与解释方法相结合的安全关键系统的鲁棒性。这些系统在医学图 - 基于特征重要性的视觉解释方法的稳定性,正确性和可信度
在可解释性人工智能领域,本文研究了基于图像分类器特征重要性的解释方法的稳定性、正确性和合理性之间的关系,并指出现有的评估指标并不总是一致的,进而提出了考虑被测模型的局部行为的新型评估指标。
- 图像分类器的多种不同解释
给定一张图片的黑盒图像分类器的输出,我们描述了一种基于因果理论的算法和工具 REX,用于计算该图像的多个解释,并通过实验证明 REX 在 ImageNet-mini 基准测试上能够找到比之前方法多 7 倍的图像的多个解释。
- 防护信函设计方向
通过使用迭代快速梯度符号方法(I-FGSM)测量字母的防御性,并建立深层回归模型估计每个字母图像的防御性,本文提出了与字母图像的对抗脆弱性相关的三个研究问题:(1)字母对抗攻击的防御能力如何?(2)在攻击之前,我们能否估计给定字母图像的防御 - 一般的 Lipschitz:通过转换依赖随机平滑实现可解决语义转换的认证鲁棒性
提出了一种新的框架,称为 “General Lipschitz(GL)”,用于基于随机平滑的神经网络分类器的可证明鲁棒性,以对抗可组合的解决的语义扰动。在该框架内,分析了平滑分类器相对于参数变换的依赖性和对应的鲁棒性证书,与 ImageNe - 通过对抗训练提升视觉识别的视点稳健性
通过使用敌对训练的方法,我们提出了一种称为 VIAT 的视角不变敌对训练方法,用于改善图像分类器的视角鲁棒性,并基于 GMVFool 提供了一个大规模数据集 ImageNet-V + 来评估视角鲁棒性。实验结果表明,VIAT 通过 GMVF - Zoom 是必需品:图像分类中 Zoom 的强大和空间偏差的实证研究
研究了六种不同的神经网络模型,确认透过图像缩放以提取最重要信息,并通过基于缩放的数据增广技术(TTA)来提高分类准确性,提出了一个新的基准 ImageNet-Hard。
- 基于文本引导的鲁棒性基准测试
本研究探讨了图像分类器对以文字为导向的失真的鲁棒性,并利用扩散模型对图像进行不同域的编辑,研究结果表明: 在不同语言为基础的失真和编辑域中,图像分类器的性能显著下降,卷积模型比变压器架构更为鲁棒,同时,常见的数据扩充技术可以提高原始数据和编 - 识别图像分类器在稀有子组上的系统误差
使用 PromptAttack 在图像分类器中识别具有普遍错误的子组。
- ICLR基于框架的分类外分布检测基准及其在 ImageNet 上的应用
本文提出了一种用于评估图像分类器检测类别 - 分布外实例能力的新框架,并将该技术应用于 ImageNet 数据集,分析结果揭示了多个新观察,包括知识蒸馏能够一致提高分布外实例检测性能,ViTs 的子集比任何其他模型都能更好地检测出分布外实例