Jul, 2022

卷积神经网络自注意力的彩票假设

TL;DR通过实验证明,将自注意力模块 (SAMs) 连接到所有块并不总是会带来最大的性能提升,而将其连接到部分块效果更好。此外,提出了自注意力网络抽奖票假说:完整的自注意力网络包含一部分稀疏自注意力连接的子网络能够加快推理速度,减少额外参数增量并保持准确性,同时还提出了一种基于强化学习的搜索方案。实验表明,搜索到的方案能够转移到某些视觉任务,例如人群计数和分割。