使用合成梯度的分离神经接口

Aug, 2016

Decoupled Neural Interfaces using Synthetic Gradients

Max Jaderberg, Wojciech Marian Czarnecki, Simon Osindero, Oriol Vinyals, Alex Graves...

TL;DR通过引入对神经网络图计算的未来模型，预测梯度和输入；实现神经网络各部分的解耦，异步更新；并对前馈模型、循环神经网络、分层 RNN 等进行了实验和验证。

Abstract

Training directed neural networks typically requires forward-propagating data through a computation graph, followed by backpropagating error signal, to produce weight updates. All layers, or more generally, modules, of the network are therefore locked, in the sense that they must wait

neural networks asynchronous training synthetic gradients recurrent neural networks hierarchical rnn system

发现论文，激发创造

理解合成梯度和解耦神经接口

本文通过在前馈网络中使用合成梯度来研究解耦神经接口 (DNIs)，证明了合成梯度对于神经网络的表示强度没有影响，并证明了它在线性和深度线性模型中的学习系统的收敛性，并揭示了使用合成梯度估计器来近似真实损失的机制，及其如何导致截然不同的分层表示。最后，还揭示了使用合成梯度与其他误差近似技术的关系，为相关讨论和比较提供了一种统一的语言。

Mar, 2017

解耦图神经网络：同时训练多个简单的 GNN，而不是一个复杂的网络

提出了一种将多层 GNN 分解为多个简单模块的框架，并采用前向和后向训练机制进行高效训练，可以避免由于层数增加导致的依赖性快速增长和大量时间消耗。通过理论证明和实验结果表明，该框架的性能可行且高效。

Apr, 2023

卷积神经网络的解耦贪心学习

本文提出了解决反向传播过程中每层必须等待信号传播整个网络才能更新的锁定问题的替代方案 Decoupled Greedy Learning，通过使用最小反馈进行网络训练，并探讨了该方案的优化方法，可以在线性层级并行化的情况下独立地训练网络层或模块，本方案能够在异步环境下运行，并且具有更好的泛化性能，实验证明其对于 CIFAR-10 数据集和大规模 ImageNet 数据集的分类效果优于其他方案。

Jan, 2019

具收敛保证的解耦并行反向传播算法

我们提出了一种去耦合的并行反向传播算法，利用延迟梯度解除了反向锁定，保证了深度学习的优化收敛性，并在标准数据集上展示了该算法的实验结果。

Apr, 2018

大规模动态图的解耦图神经网络

本文提出了一种分离式图神经网络方法，适用于连续型和离散型大型动态图，通过统一的动态传播方法，能够在预测任务中支持序列模型，实现了卓越的可扩展性和表现力，实验结果在连续型和离散型动态图上均达到了最先进表现。

May, 2023

利用模块解耦加强时态图网络

动态图学习的现代方法应用批处理而非逐一更新，本研究提出了一种解耦策略以实现频繁更新，开发了轻量级解耦时态图网络模型 (LDTGN)，在各种动态图基准测试中验证了其较高效率和结果优于之前方法的性能。

Oct, 2023

终结端到端：隔离梯度学习表征

提出了一种新颖的基于深度学习的本地自监督表示学习方法，该方法不需要标签，也不需要端到端反向传播，而是利用数据中的自然顺序进行。该方法充分利用神经网络的生物学原理，将深度神经网络分成一堆梯度隔离的模块，每个模块都被训练成最大限度地保留其输入信息，以期创建具有自监督表示学习的深度神经网络，并在音频和视觉领域的下游分类任务中获得了高竞争结果。同时，该方法能够异步优化模块，允许在未标记的数据集上进行大规模分布式训练。

May, 2019

大规模时间视频建模的梯度正向传播

本文介绍了一种名为 Skip-Sideways 的神经网络训练方法，其通过时间跳跃机制和分布式异构设备进行训练，能够有效地提取时间特征以及实现低延迟训练和模型并行化，并在动作识别等领域中获得更好的性能。

Jun, 2021

解耦图神经网络的深度和范围

为了解决现有 GNN 模型在图形和模型规模上的可伸缩性有限的问题，我们提出了一种设计原则来解耦 GNN 的深度和范围，从而获得更好的表达能力和更少的计算成本。

Jan, 2022

前馈神经网络的因果发现和注入

本文通过向前馈神经网络注入潜在的因果关系，以保证神经网络模型符合专家知识，从而提高模型在发现因果关系和预测性能方面的鲁棒性和精度。

May, 2022