BriefGPT.xyz
Ask
alpha
关键词
reversible architectures
搜索结果 - 1
PETRA: 并行端到端训练与可逆架构
我们介绍了一种用于并行计算深度模型训练的 PETRA 替代方法,它通过反向传播和单一参数版本的保持来解决权重存储的问题,并在 CIFAR-10、ImageNet32 和 ImageNet 上展示了其与后向传播相比具有竞争性的准确性。
PDF
a month ago
Prev
Next