Jul, 2023

深度学习的速度限制

TL;DR神经网络训练需要极高的计算能力,本文应用了随机热力学近期的进展来界定训练网络从初始权重分布转化为完全训练好的网络的速度上限,针对线性和可线性的神经网络提供了这些速度上限的解析表达式,发现在一些合理的缩放假设下,学习是在缩放意义上最优的,与卷积神经网络和全连接神经网络的实验结果相一致。