Jun, 2023

基于采样技术的深度神经网络训练方法在计算资源有限情况下的可拓展性评估

TL;DR本文通过在大规模 CPU 机器上评估近似矩阵乘法的两种采样方法,提供了负面的理论分析,这表明前馈逼近是可扩展性的障碍。作者指出基于哈希的节点选择方法不能扩展到大量层数,并确定了未来研究的方向。