探索深度神经网络中的异常表示

Jun, 2022

DORA: Exploring outlier representations in Deep Neural Networks

Kirill Bykov, Mayukh Deb, Dennis Grinwald, Klaus-Robert Müller, Marina M.-C. Höhne

TL;DR这篇论文介绍了 DORA（Data-agnOstic Representation Analysis）框架，它利用网络内部的自我解释能力，提出了一种新的距离度量方法，对 DNNs 的表示空间进行了数据无关的分析。通过这个度量方法，可以检测到可能存在风险的异常表示，该方法最终应用于分析并识别了广受欢迎的计算机视觉模型中的人工异常表示。

Abstract

deep neural networks (DNNs) draw their power from the representations they learn. However, while being incredibly effective in learning complex abstractions, they are susceptible to learning malicious concepts, due to the spurious correlations inherent in the training data. So far, exi

deep neural networks representation analysis anomalous representations spurious concepts computer vision

发现论文，激发创造

确定性不确定性量化方法上的判别距离感知表示

该研究介绍了一种名为 Discriminant Distance-Awareness Representation（DDAR）的新颖且高效的确定性不确定性评估方法，通过构建一个在潜在表示中包含一组原型的 DNN 模型来分析输入数据的有价值特征信息，通过松弛限制了决定性不确定性方法（DUMs）架构的利普希茨条件，从而克服了特征坍缩问题，实验结果表明 DDAR 是一种灵活且与架构无关的方法，在多个基准问题上优于现有的不确定性评估方法。

Feb, 2024

一种检测深度神经网络分类器异常输入的通用框架

提出了一种基于多层神经网络内部表征的无监督异常检测框架，其中包括可配置组件的元算法，具有面向统计检验和异常检测的具体实例，并且被评价为在检测敌对攻击和超出分布输入方面比其竞争方法更有效。

Jul, 2020

无监督条件下理解深度神经网络中概念的分布表示

本文提出了一种新的无监督方法，通过选择主要的神经元子集来发现概念的分布式表示，该方法可以用于识别数据中的未标记子类，并检测错误分类的原因，同时还揭示了不同层次的深度学习模型内部机制的深入洞察。

Dec, 2023

一种全面可靠的特征归因方法：双侧去除重构（DoRaR）

通过改进方法，我们引入了一种名为 DoRaR 的特征归属方法，解决了透明度受限、黑盒模型等困扰，通过对 MNIST、CIFAR10 和自行合成的数据集的全面测试，证明了 DoRaR 特征归属方法能有效绕过上述问题，并有助于训练优于其他最先进特征归属方法的特征选择器。

Oct, 2023

大规模天文调查中的样本外泛化：健壮网络学习相似表示

机器学习模型在处理来自未来天文调查的离域样本时依然面临挑战，解释性方法通过使用相似性度量来检查预训练卷积神经网络在中心核对齐方面的性能与表示相似性之间的关系，发现当模型对分布变化具有稳健性时，在离域数据上，图像在网络层之间的表示会有较大变化；然而，当模型无法泛化时，在离域数据上，这些表示在网络层之间的变化较小。讨论了这种相似性表示在模型设计、训练策略以及通过在训练过程中加入中心核对齐作为归纳偏差来缓解离域问题方面的潜在应用。

Nov, 2023

深度神经网络的表示距离学习

该研究提出了一种称为 “代表空间距离学习” 的方法，该方法可用于将一种深度神经网络模型学习到的内部表现空间应用到另一种模型之中，通过该方法可将学生模型的表现空间序列逐步拟合为更接近于教师模型表现空间的序列。通过将学生模型的表现空间逐渐接近于教师模型的表现空间，使用该方法可以显著提高可视化分类性能。未来该方法可以应用于将深度神经网络的任务约束和生物大脑的约束相结合，从而构建出可以复制生物大脑内部表现空间的深度神经网络模型。

Nov, 2015

表征拓扑差异：用于比较神经网络表征的方法

提出了基于 Representation Topology Divergence (RTD) 的数据表示比较方法，该方法是 few TDA-based practical methods 之一，可以应用于真实的机器学习数据集，用于对计算机视觉和 NLP 领域中的神经网络表示进行分析。

Dec, 2021

DARI: 人物验证的距离度量与表示集成

本文提出了名为 DARI 的端到端学习框架，其中将距离度量和特征表示融合在一起。通过使用深度卷积神经网络来解决距离不匹配问题，证明了 DARI 在人员验证等方面的有效性，并在多个公共数据集中实现了最佳性能。

Apr, 2016

离群数据：对抗样本的熟悉 —— 综述

深度神经网络在现实应用中会遇到来自分布失真和对抗性攻击的数据，本综述聚焦于这两个领域的交叉研究，探讨如何通过鲁棒的分布失真检测和统一的鲁棒性进行对抗性攻击和对分布失真数据的健壮处理。

Apr, 2024

可证明鲁棒性的无需付出昂贵代价的异常检测

研究使用机器学习技术的安全关键系统需要可靠的不确定性评估。本研究发现，深度神经网络在处理分布外数据时可能会产生过度自信的预测。本研究提出了一种具有保护分布外数据和高准确度的分类器，并提供所有实验代码。

Jun, 2021