Feb, 2019

Passed & Spurious: 基于下降算法的带尖峰矩阵-张量模型的局部极小点

TL;DR本研究分析了梯度下降和其他算法在典型推理问题中对损失景观和性能之间的相互作用,并在spiked matrix-tensor模型上以负对数似然为损失函数来研究了大信噪比条件下的局部极小值数量及其所在位置。我们使用物理中无序系统的积分微分PDE分析了梯度流算法的性能,并分析了一种通过状态演化来估计极大似然配置的近似消息传递算法的性能。结果表明,尽管我们观察到景观的平凡化导致梯度流动力学明显放缓,但两种分析算法在存在虚假局部最小值的参数区域的部分区域中都表现良好。