Mar, 2024

光谱卷积变换器:为视觉变换器协调实数与复数多视角光谱算子

TL;DR通过在初始层使用卷积操作捕获局部信息,并利用复杂的傅里叶基函数捕获全局信息,我们提出了光谱卷积变换器(SCT),在减少参数的同时提供了在ImageNet数据集上胜过现有方法的性能改进,达到了84.5%的top-1准确度,在CIFAR-10、CIFAR-100、Oxford Flower和Stanford Car等数据集上进行了传递学习和下游任务评估,包括MSCOCO数据集上的实例分割。