Feb, 2024

基于Vision Transformer的简单且高效网络用于伪装物体和显著物体检测

TL;DR本文提出了一种简单而有效的基于Vision Transformer(ViT)的网络(SENet),通过采用一种基于不对称ViT的编码器-解码器结构的简单设计,在隐藏目标检测和显著目标检测两个任务上取得了有竞争力的结果,在精细设计的复杂网络上展现出更大的多样性。