Aug, 2024

ssProp:具有定时稀疏反向传播的卷积神经网络的节能训练

TL;DR本研究针对深度学习训练中高资源消耗和环境影响问题,提出了一种节能高效的卷积模块,能够与任何深度学习架构无缝集成。通过引入通道稀疏性和额外的梯度选择调度器,该方法在图像分类和生成任务中展示了高达40%的计算量减少,同时改善了模型性能,显著降低了能源消耗和碳足迹。