物品或关系 — 人工神经网络学习了什么？

Apr, 2024

物品或关系 — 人工神经网络学习了什么？

Items or Relations -- what do Artificial Neural Networks learn?

Renate Krause, Stefan Reimann

TL;DR人工神经网络（ANN）通过成功训练来解决任务后，学到的是训练项集还是它们之间的关系？在现代应用的 ANN 中，这个问题很难回答，因为其规模和复杂性巨大。因此，我们在这里考虑一个低维网络和一个简单任务，即网络必须完全复制一系列训练项。我们通过分析构建了解析解的解集家族，并使用标准的学习算法得到数值解。这些数值解根据优化算法和权重初始化的不同而不同，并且被证明是解析解解集的特定成员。在这个简单的设置中，我们观察到网络权重的一般结构表示训练集的对称群，即训练项之间的关系。因此，线性网络具有泛化能力，即可以复制不属于训练集但与训练集的对称性一致的项。相反，非线性网络倾向于学习各个训练项，并显示出联想记忆的特点。同时，它们的泛化能力有限。具有包含线性区域的激活函数（如 tanh）的网络具有更高程度的泛化能力。我们的结果表明，ANN 的泛化能力可以通过生成足够大的基本操作集来表示关系，并且它强烈依赖于应用的非线性特性而得到改善。

Abstract

What has an artificial neural network (ANN) learned after being successfully trained to solve a task - the set of training items or the relations

artificial neural network training items relations generalization activation function

发现论文，激发创造

人工神经网络与人类概念的表征

人工神经网络在复杂预测任务中能够学习人类和非人类概念，但证据表明它们不以个别单元形式表示这些概念。

Dec, 2023

关系数据的神经网络

该研究针对深度神经网络在社交网络分析等结构化领域表现不佳的问题，提出了一种新方法，即基于关系随机游走的特征和参数共享的关系神经网络。实验证明，该方法在多个标准关系数据集上的表现优于多种神经网络和统计关系模型。

Aug, 2019

统计力学与人工神经网络：原理，模型和应用

神经科学，人工神经网络，统计力学，Hopfield 网络和 Boltzmann 机器是人工神经网络领域的主要研究课题。通过研究人工神经网络中的丢失函数的几何特征和可视化方法，可以提高其优化行为、泛化能力和整体性能。

Apr, 2024

排列不变智能体的最小神经网络模型

通过限制输入的排列和尺寸，构建了一种可以灵活应对变化，具有新型 ANN 模型的结构，该模型能够在多个控制问题上表现出 ANN 所缺乏的灵活性，并且可以处理输入索引的快速排列，证明了其在很大程度上具有优越性。

May, 2022

社交学习智能体语言演化和分析框架

本研究提出一种模拟语言特征的通信协议，通过将高维信息编码为低维表示来分析对任务表现的影响，进而提高任务完成率，并强调了语言作为代理之间共同表征的作用及其对泛化能力的影响。

May, 2023

神经网络逼近

该篇论文调查了神经网络的近似性质，特别是使用 ReLU 激活函数的非线性流形，并比较了这种近似方法与传统数值分析中使用的近似方法之间的差异，着重分析了数值稳定性问题，发现在一定程度上提高了近似能力，但以数值稳定性为代价。

Dec, 2020

人工神经网络中基于大脑启发的学习策略综述

本篇论文全面综述了现今人工神经网络中基于仿生学学习机制的表示，研究了加入更多仿生意义机制如突触可塑性以加强网络能力的可能性和挑战，并找到未来的研究方向，以更深入理解智能的本质。

May, 2023

从生物到人工神经网络的转化与借鉴

本文探讨了如何利用深度学习来研究神经健康以及在算法模型中解释神经分析的困难。其重要贡献在于调查死亡神经元对人工神经网络性能的影响，以评估这些发现在生物领域的潜在应用，可能对神经系统疾病的治疗有重要影响。

Jun, 2023

同构人工神经网络

本文提出了一种人工神经网络（ANN），作为一类特殊函数（称为广义齐次函数）的全局逼近器。证明了一种齐次通用逼近定理，并提出了将现有 ANN 升级为齐次 ANN 的方法。理论结果通过计算机科学、系统理论和自动控制领域的示例进行支持。

Nov, 2023

深度学习最近提出的激活函数综述

介绍了人工神经网络中激活函数的主要概念及其作用，讨论了各种激活函数类型、应用、限制和替代方案。

Apr, 2022