Jun, 2024

等变神经网络的分离能力

TL;DR我们提出了一个理论框架来研究具有点逐元激活的等变神经网络的分离能力,我们能够推导出一族神经网络对于给定架构的输入无法区分的显式描述,证明其不受所采用的非多项式激活函数选择的影响,我们证明了激活函数在可分性中的作用,所有非多项式激活函数,如ReLU和sigmoid,在表达能力方面是等价的,并且达到了最大的区分能力,我们演示了如何简化等变神经网络的分离能力评估为评估最小表示的分离能力,并且说明了这些最小组件如何形成分离能力的等级结构。