Mar, 2022

基于傅里叶域分析的深度视觉变换器中的防过度平滑技术:从理论到实践

TL;DR本研究针对Vision Transformer深度增加时性能达到饱和的问题提出了两种有效而无需超参数的技术AttnScale和FeatScale,能够有效克服与注意力折叠和补丁均匀性等相关的ViT训练伪像。