ICCVMay, 2021

为什么近似矩阵平方根在全局协方差池化中表现优于准确的奇异值分解?

TL;DR研究了基于全局协方差池化的卷积神经网络,使用奇异值分解方法计算矩阵平方根,发现通过牛顿 - Schulz 迭代而非精确计算的矩阵平方根能更好地提高分类性能,并提出了新的基于 Padé 近似的反向传播方法和混合训练协议,该方法在大规模和细粒度数据集上实现了最先进的性能。