Oct, 2023

大象神经网络:天生的持续学习者

TL;DR通过研究神经网络的激活函数在训练动态和遗忘问题上的影响,本研究揭示了稀疏表示和激活函数的梯度稀疏性在减少遗忘方面的重要作用,并提出了一种名为 elephant 激活函数的新类别的激活函数,它能够生成稀疏表示和稀疏梯度,通过用 elephant 激活函数替换传统激活函数,可以显著提高神经网络对遗忘的韧性。该方法在回归、类递增学习和强化学习任务中都具有广泛的适用性和益处,在 Split MNIST 数据集上只需一个遍历就能取得出色的性能,而无需使用回放缓冲区、任务边界信息或预训练。