Jun, 2021

早期卷积有助于变压器更好地视觉

TL;DR通过将卷积干部替换为小型的步幅为2的3*3卷积,研究人员证明了将视觉变换器模型的初始处理更改为标准卷积干部可以显著提高最终模型的稳定性,并提高峰值性能.