利用自组织映射在神经网络中寻找概念表示

Dec, 2023

利用自组织映射在神经网络中寻找概念表示

Finding Concept Representations in Neural Networks with Self-Organizing Maps

Mathieu d'Aquin

TL;DR神经网络学习过程中，通过自组织映射可以视觉和计算地检测神经网络各层激活向量与抽象概念之间的对应关系，并且相对熵可以用作一种合适的方法来识别和定位概念的神经表示，实现概念的可视化并理解其在解决预测任务中的重要性。

Abstract

In sufficiently complex tasks, it is expected that as a side effect of learning to solve a problem, a neural network will learn relevant abstractions of the representation of that problem. This has been confirmed

neural network abstractions self-organizing maps activations visual concepts

发现论文，激发创造

将知识表征映射到概念：回顾与新视角

该研究审查了通过提出分类法来将人类可理解的概念与神经网络中的内部表示相对应的研究，并发现了与模型可解释性目标有关的文学研究中的歧义，即是理解机器学习模型还是在部署领域有用的可行解释。

Dec, 2022

基于神经网络的语义空间认知图形生成及抽象概念的出现

该研究使用神经网络学习 32 种动物的特征向量，并基于继承表示原理构建了一个 “动物空间” 的认知地图，该地图能够使用插值技术准确地表示完全新的或不完整的输入，并在不同的认知地图级别中呈现出不同的特征。

Oct, 2022

用概念显著性图像可视化深度生成模型中相关特征

提出了一种新的方法来获得生成模型中已知或新的高级概念的显著性图，即概念显著性图，对于深度学习中的潜在变量模型提高了解释性。该方法被应用于 CelebA 数据集的 VAE 潜在空间中和小鼠嗅球的空间转录组数据中，证明了其在高级概念的解释和复杂生物系统理解中的潜力。

Oct, 2019

使用神经继承网络和词嵌入形成概念认知地图

介绍了一种使用继任表示和神经网络的模型，以及单词嵌入向量，用于构建三个不同概念的认知图，从而根据输入提供多模态上下文信息，基于输入和预先存在的知识表示的相似性度量。

Jul, 2023

自适应概念学习的 Web 图像校正自组织映射

本文提出了一种从嘈杂的 Web 图像搜索结果中自动学习概念的方法，旨在通过发现子集间共同特征并消除无关实例的方法，基于弱标签数据集学习更高层次的概念，并提出了一种名为 Rectifying Self Organizing Maps (RSOM) 的聚类和离群点检测方法。该方法在学习低级别概念的任务上优于现有研究，而且在学习高级别概念方面也极具竞争力，并且能够利用现有资源在大规模上无监督地工作。

Dec, 2013

理解概念激活向量：解释可解释性

使用概念解释将深度学习模型的内部表示转化为人类熟悉的语言，最近的解释性方法提议采用基于概念的解释。本文研究了 Concept Activation Vectors (CAVs) 的三个性质，它们可能在不同层次之间存在不一致性，与不同概念纠缠在一起，并具有空间依赖性，这些性质为解释模型提供了挑战和机会。同时，我们还介绍了工具来检测这些性质的存在，并提供洞见以了解它们对解释的影响，并提出减小它们影响的建议。通过理解这些性质，我们可以利用它们的优势。例如，我们引入了具有空间依赖性的 CAVs 来测试模型在特定概念和类别上是否具有平移不变性。我们在 ImageNet 和一个新的合成数据集 Elements 上进行实验。Elements 旨在捕捉概念与类别之间已知的真实关系。我们发布此数据集以促进对解释性方法的进一步研究和评估。

Apr, 2024

神经网络的以人为本的概念解释

该研究论文介绍了基于概念的解释，比如概念激活向量可以有效地描述概念，并讨论了自动提取概念的方法，展示了它们在真实世界应用中的效用。

Feb, 2022

MRI 可解释的概念映射：揭示基于深度学习的脑疾病分类的机制

通过对深度神经网络学习的概念进行系统性研究，可以确定变化的大脑区域用于模型验证，从而增加疾病分类模型的可靠性。

Apr, 2024

基于神经网络的空间和语言的后继代表

使用神经网络学习多尺度接班人表达，进而构建认知地图和神经网络接班人表达的结构化知识表示形式，实现了在监督学习、强化学习和非空间任务中精确学习并逼真模拟了海马 - 内部子网所观察到的神经元放电模式，为克服深度学习在人工通用智能方面的一些缺陷提供了一种有前途的途径。

Feb, 2022

表示、索引和操作概念的简单机制

利用深度网络，基于概念分类器通过梯度下降的训练，我们提出通过观察概念的矩阵统计特征来生成其具体表示或特征签名，进而发现概念集合之间的结构，并通过学习这些特征签名的结构递归生成更高级的概念。当概念相交时，利用概念的特征签名可以找到一种共同主题，并可用于建立概念字典，从而使输入正确识别和路由到参与生成输入的概念集合。

Oct, 2023