Jun, 2024
PETRA: 并行端到端训练与可逆架构
PETRA: Parallel End-to-end Training with Reversible Architectures
Stéphane Rivaud, Louis Fournier, Thomas Pumir, Eugene Belilovsky, Michael Eickenberg...
TL;DR我们介绍了一种用于并行计算深度模型训练的 PETRA 替代方法,它通过反向传播和单一参数版本的保持来解决权重存储的问题,并在 CIFAR-10、ImageNet32 和 ImageNet 上展示了其与后向传播相比具有竞争性的准确性。