Jun, 2024

PETRA: 并行端到端训练与可逆架构

TL;DR我们介绍了一种用于并行计算深度模型训练的 PETRA 替代方法,它通过反向传播和单一参数版本的保持来解决权重存储的问题,并在 CIFAR-10、ImageNet32 和 ImageNet 上展示了其与后向传播相比具有竞争性的准确性。