Jan, 2024

揭示不可见的东西:训练的深度可分卷积核中的可识别聚类

TL;DR最近在深度可分离卷积神经网络(DS-CNNs)方面的进展已经引发了新的架构,通过相当大的可扩展性和准确性优势,超越了经典 CNNs 的性能。本文揭示了 DS-CNN 架构的另一个引人注目的特性:它们训练后的深度卷积核在所有层中出现了明显可辨和可解释的模式。通过对数百万个训练滤波器的广泛分析,我们使用自编码器进行无监督聚类,对这些滤波器进行了分类。令人惊讶的是,这些模式汇聚成了几个主要簇,每个簇都类似于高斯差分函数(DoG)及其一阶和二阶导数。值得注意的是,我们能够将来自最先进的 ConvNextV2 和 ConvNeXt 模型的滤波器分别分类为 95%和 90%以上。这一发现不仅仅是技术上的奇特之处;它回应了神经科学家长期以来对哺乳动物视觉系统的基础模型的提议。因此,我们的结果加深了对训练后 DS-CNN 的出现属性的理解,并在人工和生物视觉处理系统之间提供了一个桥梁。更广泛地说,它们为未来更具可解释性和生物灵感的神经网络设计铺平了道路。