May, 2023

探索视觉 Transformer 层在语义分割中的选择

TL;DR本文提出了一种名为 ViTController 的网络结构,用于动态自适应融合和特征选择,优于以往方法,可作为插件模块插入不同的网络。