Jun, 2022

探索深度神经网络中的异常表示

TL;DR这篇论文介绍了 DORA(Data-agnOstic Representation Analysis)框架,它利用网络内部的自我解释能力,提出了一种新的距离度量方法,对 DNNs 的表示空间进行了数据无关的分析。通过这个度量方法,可以检测到可能存在风险的异常表示,该方法最终应用于分析并识别了广受欢迎的计算机视觉模型中的人工异常表示。