Jun, 2019

利用卷积在干草堆中寻找针头:探讨结构偏置的优势

TL;DR该研究通过比较卷积神经网络(CNN)和全连接网络(FCN)在损失景观中的动态性来探讨它们究竟有什么不同。他们引入了一种将CNN映射为其等效FCN(称为eFCN)的方法,以直接在FCN空间中比较CNN和FCN的培训动态。该研究还测试了一种新的培训协议,证明了eFCN对于某些中间时刻可以优于CNN。这表明在优化的早期阶段,CNN的先验有助于浏览损失景观,从而实现更好的泛化。