Sep, 2023

随机梯度下降在玻璃能量地形中恢复高维信号的效果优于梯度下降

TL;DR使用随机梯度下降(SGD)算法对神经网络进行培训,研究表明 SGD 在优化高维度非凸成本函数方面比梯度下降(GD)算法更为有效。