Feb, 2016

卷积层Kronecker分解近似Fisher矩阵

TL;DR本文提出了基于结构化概率模型的KFC来近似求解卷积网络的Fisher矩阵,采用Kronecker deomposition来使得每个块都是小矩阵,从而实现更快的求逆和更高效的训练。实验表明,KFC能够比SGD更快的训练卷积网络,具有在分布式环境中应用的潜力。