神经网络中的信用分配通过深度反馈控制
通过使用反馈对齐算法,提出了一种生物相似性算法来替代反向传播,用一个稀疏的反馈矩阵可以显著改进数据移动和计算的效率,与反向传播相比,可以实现数量级的改进,并且可以在某些方面获得硬件优势,同时还可以获得具有可比性的结果。
Jan, 2019
本文基于动态系统和最优控制的视角, 将现有的深度学习理论框架进行整合, 并用随机动态的优化算法作为控制器,为超参数调整提供了一个基于原则的方法。
Aug, 2019
本文讨论了反向传播算法的神经可行性,研究了一种竞争性的局部学习规则和几种使权重传输过程更生物学可行的非局部学习规则,并提出了两条无需权重对称的神经实现学分分配的路径。
Feb, 2020
本研究使用元学习发现网络如何利用反馈机制和本地、仿生学习规则,以进行在线信用分配,并超越了现有的基于梯度的算法在回归和分类任务方面的性能,特别是在持续学习方面表现优异,结果表明存在一类生物可行的学习机制,不仅匹配梯度下降,而且还克服了其局限性。
Jun, 2020
本文提供了能量基模型(EBMs)在逼近反向传播(BP)方面的综合理论,统一了预测编码、平衡传播和对比 Hebbian 学习等算法,从 EBMs 的自由相平衡这一简单而普遍的数学特性出发,在不同的能量函数下进行选择以得出一类逼近 BP 的算法。
May, 2022
提出了一种基于突触可塑性动态的学习规则,该规则通过融合强化学习和非监督学习模拟误差反馈机制和两个重要机制,包括错误反馈系统以及非监督学习。
Mar, 2023
本文揭示了支持反馈对齐学习动力学的一组守恒定律,揭示了反馈对齐与梯度下降之间的有趣类比,挑战了这些学习算法根本不同的流行说法,并表明这些守恒定律阐明了ReLU网络中反馈矩阵的逐层对齐的充分条件,这将使得使用反馈对齐训练的两层线性网络收敛到最小化范数的解决方案。
Jun, 2023
通过对受神经生物学启发或影响的人工神经网络中进行信用分配的算法的调查,我们提出了一个分类法,根据学习算法回答复杂自适应神经系统突触可塑性机制的核心问题的方式,整理了不断增长的大脑启发学习过程集合为六个通用家族,并在反向传播和其已知批评的背景下考虑了这些家族,结果旨在鼓励未来在神经仿真系统及其组成学习过程的发展,从而在机器学习、计算神经科学和认知科学之间建立良好的桥梁。
Dec, 2023
在生物神经网络中实现高效的学习需要对个体突触进行适应性调节,然而,由于时空依赖性的限制,目前对于如何进行高效的信用赋值仍然是一个值得研究的问题。本文提出了一种称为广义潜在均衡(GLE)的计算框架,用于在具有时空连续性神经动力学的物理网络中实现完全本地的时空信用赋值,该框架利用了生物神经元可以根据其膜电位相移其输出速率的能力。
Mar, 2024
这篇论文调研了模拟生物可行的信用分配规则在人工神经网络中的多个重要算法,并讨论了它们在不同科学领域的解决方案以及在CPU、GPU和神经形态硬件上的优势,最后讨论了未来需要解决的挑战,以使这些算法在实际应用中更加有用。
Feb, 2024