Jun, 2021
局部注意力与动态深度可分离卷积之间的联系
Demystifying Local Vision Transformer: Sparse Connectivity, Weight
Sharing, and Dynamic Weight
TL;DR本文探讨了Local Vision Transformer的前身——Vision Transformer和其一种局部注意力机制——局部连接的形式,并从network regularization角度分析了其权重的稀疏性、共享性以及动态性。此外作者还针对这种局部连接进行的实验证明它的有效性,并提供了开源实现代码。