利用代数拓扑描述神经网络嵌入空间的演化

Nov, 2023

利用代数拓扑描述神经网络嵌入空间的演化

On Characterizing the Evolution of Embedding Space of Neural Networks using Algebraic Topology

Suryaka Suresh, Bishshoy Das, Vinayak Abrol, Sumantra Dutta Roy

TL;DR通过 Betti 数我们研究了在经过深度神经网络的各个层时，特征嵌入空间的拓扑结构如何变化。我们使用了拓扑同调理论中的方格同调进行了扩展分析，使用了各种流行的深度架构和真实图像数据集。我们证明随着深度的增加，一个拓扑上复杂的数据集会被转换成一个简单的数据集，Betti 数会取得最低可能的值。拓扑复杂度的衰减速率可以量化架构选择对泛化能力的影响。此外，我们从表示学习的角度强调了几种不变性，例如 (1) 相似数据集上的体系结构、(2) 深度可变的嵌入空间、(3) 嵌入空间与输入分辨率 / 大小以及 (4) 数据子采样。为了进一步证明网络的表达能力与泛化能力之间的联系，我们考虑了下游分类任务 (迁移学习) 中预训练模型的排序任务。与现有方法相比，所提出的度量方法与通过微调预训练模型实际可达到的准确性具有更好的相关性。

Abstract

We study how the topology of feature embedding space changes as it passes through the layers of a well-trained deep neural network (DNN) through Betti numbers. Motivated by existing studies using simplicial complexes on shallow fully connected networks (FCN), we present an extended ana

feature embedding space betti numbers topological complexity architecture choices generalization ability

发现论文，激发创造

利用代数拓扑学表征神经网络的容量

本文提出代数拓扑作为数据复杂性量度，并通过实证分析展示了神经网络的拓扑容量在不同数据复杂度下都呈现相变现象，从而将现有理论和完全连接的神经网络架构的选择联系起来。

Feb, 2018

深度神经网络的拓扑学

通过对二元分类问题的数据集进行拓扑学分析，研究网络层数对于数据拓扑的影响，发现神经网络能够通过非同胚映射改变数据的拓扑结构，且 ReLU 激活函数能更有效地实现拓扑的转换。

Apr, 2020

神经网络层表示的拓扑数据分析

该论文研究神经网络层内部如何保留拓扑特征。使用拓扑数据分析技术，计算了一个简单前馈神经网络的层表征在类克莱因瓶扭结构变化下的拓扑特征。在较早层，网络看起来近似于同胚，但在较深层时数据的拓扑结构被明显更改，导致持久同调无法计算这些特征。但在具有双射激活函数的网络中，类似的拓扑特征似乎可以更持久地存在。

Jul, 2022

神经表征的拓扑分类的秩分解

神经网络的拓扑结构及同调群，以及仿射映射与任务连续性的关系的研究。

Apr, 2024

从流形学习的角度看深度神经网络架构

本文旨在比较和描述神经网络结构在几何和拓扑方面的内部表示和层间数据流动的拓扑和几何动态变化，并使用拓扑数据分析和持久性同调分形维数的概念，通过不同层次的数据集以及卷积神经网络和转换网络在计算机视觉和自然语言处理任务中的各种配置的广泛实验，为可解释的和可解释的 AI 的发展做出了贡献。

Jun, 2023

基于 Betti 数的损失面拓扑描述

通过对多层神经网络中的损失函数的拓扑度量，研究比较深层和浅层架构的复杂性以及其受隐藏单元数量、训练模型和激活函数的影响，揭示了一些特定情况下，添加正则项或在前馈网络中实施跳跃连接等对损失拓扑没有影响。

Jan, 2024

神经持久性：使用代数拓扑测量深度神经网络的复杂度

本文提出了一种基于拓扑数据分析的神经网络架构复杂性度量 —— 神经持久性，用于表征和监控结构特性，并通过此方法展示了 dropout 和 batch normalization 等深度学习社区开发的最佳实践。此外，还提出了一种基于神经持久性停止准则，可在缩短训练过程同时实现与基于验证损失的早停相当的准确性。

Dec, 2018

神经表征的广义形状度量

为了理解生物和人工神经网络的操作，研究者们需要一个标准化的工具集来量化其结构等因素对神经表征的影响，这篇论文提出了一族量化表征不同神经网络之间相似性的度量空间，利用这个框架使得神经网络表征可以整合进任意的机器学习方法中，然后利用大规模生物和深度学习数据集来验证这些方法，最终找出了神经表征之间与结构和性能之间的关系。

Oct, 2021

从拓扑学角度学习神经网络的连接性

本文提出了一种基于拓扑结构优化神经网络连接性的方法，通过为边分配可学习参数并施加稀疏约束，更聚焦有关键作用的连接，并获得在图像分类和目标检测等任务中的显著改善。

Aug, 2020

前馈神经网络学习挑战的微分拓扑视角

本文介绍了如何使用微分拓扑理论来解决 Deep Neural Networks 理论中的三个最基本挑战：表达能力，优化能力和泛化能力，特别是利用流形的微分拓扑模型来阐述 DNN 的损失函数、深度和宽度之间的交互，以及如何通过应用商拓扑来捕捉数据中的无关因素，从而实现对 DNN 架构的研究。

Nov, 2018