BriefGPT.xyz
Ask
alpha
关键词
local modeling
搜索结果 - 2
CNN 还是 ViT?透过卷积再探视觉 Transformer
本研究提出了一种新颖的高斯混合蒙版(GMM)方法,在没有预训练的情况下通过改进局部建模的方式来提升 Vision Transformer(ViT)在小数据集上的性能,实验证明该方法对于提升 ViT 的效果显著,几乎不增加额外参数或计算成本。
PDF
10 months ago
ICLR
网络中的网络
本文提出了一种新型深度神经网络结构,称为 “Network In Network”,以增强感受野内局部补丁的模型可辨别度。通过在感受野内构建微型神经网络,本文在多个数据集上展示了 NIN 在图像分类方面表现出卓越的性能与利用全局平均池化来代
→
PDF
11 years ago
Prev
Next