Aug, 2023

分层反馈传播

TL;DR该研究介绍了一种名为层次反馈传播 (LFP) 的新型训练方法,利用可解释性、具体而言是层次相关传播 (LRP),为神经网络预测器中的个别连接分配奖励,以其对解决给定任务的贡献为基础。与传统的梯度下降方法不同,LFP 在不需要梯度计算的情况下在模型中传播奖励信号。它增强了接收到积极反馈的结构,同时减少了接收到负反馈的结构的影响。理论上和经验证实了 LFP 的收敛性,并展示了在各种模型和数据集上与梯度下降方法相当的性能。值得注意的是,LFP 可以克服与基于梯度的方法相关的某些局限性,例如依赖有意义的导数。此外,我们还研究了如何将不同的 LRP 规则扩展到 LFP 中,它们对训练的影响以及潜在的应用,例如训练没有有意义的导数的模型,例如阶跃函数激活的脉冲神经网络 (SNN),或用于转移学习,以高效利用现有知识。