TL;DR通过限制输入的排列和尺寸,构建了一种可以灵活应对变化,具有新型 ANN 模型的结构,该模型能够在多个控制问题上表现出 ANN 所缺乏的灵活性,并且可以处理输入索引的快速排列,证明了其在很大程度上具有优越性。
Abstract
Organisms in nature have evolved to exhibit flexibility in face of changes to
the environment and/or to themselves. artificial neural networks (ANNs) have
proven useful for controlling of artificial agents acting
人工神经网络(ANN)通过成功训练来解决任务后,学到的是训练项集还是它们之间的关系?在现代应用的 ANN 中,这个问题很难回答,因为其规模和复杂性巨大。因此,我们在这里考虑一个低维网络和一个简单任务,即网络必须完全复制一系列训练项。我们通过分析构建了解析解的解集家族,并使用标准的学习算法得到数值解。这些数值解根据优化算法和权重初始化的不同而不同,并且被证明是解析解解集的特定成员。在这个简单的设置中,我们观察到网络权重的一般结构表示训练集的对称群,即训练项之间的关系。因此,线性网络具有泛化能力,即可以复制不属于训练集但与训练集的对称性一致的项。相反,非线性网络倾向于学习各个训练项,并显示出联想记忆的特点。同时,它们的泛化能力有限。具有包含线性区域的激活函数(如 tanh)的网络具有更高程度的泛化能力。我们的结果表明,ANN 的泛化能力可以通过生成足够大的基本操作集来表示关系,并且它强烈依赖于应用的非线性特性而得到改善。