高效使用内存的时间反向传播

Jun, 2016

Memory-Efficient Backpropagation Through Time

Audrūnas Gruslys, Remi Munos, Ivo Danihelka, Marc Lanctot, Alex Graves

TL;DR我们提出了一种新方法来降低通过时间反向传播算法在培训循环神经网络时的内存消耗，这种方法使用动态规划来平衡中间结果的缓存和重新计算之间的折衷，并最小化计算成本。

Abstract

We propose a novel approach to reduce memory consumption of the backpropagation through time (BPTT) algorithm when training recurrent neural networks (RNNs). Our approach uses →

backpropagation through time recurrent neural networks dynamic programming memory consumption computational cost

发现论文，激发创造

长时依赖网络的时间反向传播

本文介绍一种称为离散前向灵敏度方程和其变体的反向传播方法，该方法准确而且允许网络参数在每个后续步骤之间变化，但需要计算 Jacobian 矩阵，以适应现今人工神经网络的长期依赖关系的发展趋势。

Mar, 2021

通过活性和参数的稀疏组合实现高效实时递归学习

本文提出，对于循环网络，高效的实时递归学习可以通过结合活动稀疏性和参数稀疏性得到显着的计算和存储成本节省，无需使用任何近似来学习过程。

Mar, 2023

低通递归神经网络 - 一种用于发现更长期的相关性的记忆体系结构

本文提出了一种使用简单且有效的记忆策略来扩展反向传播时间的窗口而不需要更长跟踪的方法，并在一些任务中进行了实证探讨。

May, 2018

自适应截断反向传播通过时间来控制梯度偏差

本文提出了一种适应性的 TBPTT 方案，将时间滞后问题转化为选择一定容忍梯度偏差量的问题，并对于满足几何衰减的真实 RNNs，可以通过变化截断长度来控制偏差，证明了该偏差控制了含非凸损失函数的 SGD 的收敛速度，并设计了一种实用的适应性截断长度的方法。在语言模型任务上的实验表明，适应性 TBPTT 减轻了固定 TBPTT 的计算缺陷。

May, 2019

稀疏关注回溯：通过提醒实现时间信用分配

为了学习长期依赖性，本文提出了一种新算法，在过去状态中关联与当前状态相关的记忆，通过注意力机制实现长期跳跃连接，用于逐步向过去传递信用分配，该算法相对于有反向传播实现的算法具有更好的性能。

Sep, 2018

基于扰动的递归神经网络学习

本研究针对循环神经网络提出了一种基于扰动学习的新方法，通过在时间域内进行节点扰动，实现与反向传播方法相媲美的性能，具有超越梯度方法的优势，证明了扰动学习方法是训练循环神经网络的一种多功能替代方案。

May, 2024

复苏和改进递归反向传播

本文重新审视了递归反向传播算法（RBP）及其适用条件，提出了基于共轭梯度和 Neumann 级数的两个改进算法，并在三个不同的应用领域进行了实验。实验证明，尤其是 Neumann-RBP 变体，对于优化收敛的循环神经网络效率高且有效。

Mar, 2018

基于生物学启发的循环神经网络学习的反向传播时序算法替代方案

通过实时与合适的自上而下学习信号合并本地可用信息，为循环神经网络提供了高效的学习算法，其中包括了神经形态芯片的在线训练，从而拓宽了大脑中的网络学习理解并在实验中得到了验证。

Jan, 2019

递归神经网络中的反向传播算法和储备计算用于复杂时空动态预测

本文研究使用循环神经网络以及储备计算和时域反向传播来预测高维和低维复杂系统的时空动态，结果表明：对于长期预测混沌系统，当全部状态动态数据用于训练时，储备计算方法的预测性能优于时域反向传播，但在使用低维数据时时域反向传播方法表现更好。同时该研究还首次量化了使用时域反向传播方法的 Lyapunov 谱。

Oct, 2019

通过活动稀疏性和时间上的稀疏反向传播实现高效的循环神经网络结构

通过实现神经元活动的动态稀疏化，提出了一种基于门控循环单元（GRU）并适用于新颖的节能神经形态硬件的递归神经网络（RNN）的通信稀疏离散化解决方案。该模型在不影响任务性能的前提下实现了高效，与现有最先进的循环神经网络模型在语言建模等实际任务中表现同样出色。

Jun, 2022