BriefGPT.xyz
Ask
alpha
关键词
weight mask
搜索结果 - 2
CNN 还是 ViT?透过卷积再探视觉 Transformer
本研究提出了一种新颖的高斯混合蒙版(GMM)方法,在没有预训练的情况下通过改进局部建模的方式来提升 Vision Transformer(ViT)在小数据集上的性能,实验证明该方法对于提升 ViT 的效果显著,几乎不增加额外参数或计算成本。
PDF
10 months ago
使用位置映射回归网络进行联合 3D 面部重建和密集对齐
本文提出一种简单的方法,可以同时重建三维人脸结构并提供密集对齐。该方法使用称为 UV 位置映射的二维表示来记录完整面部的三维形状,并使用简单卷积神经网络从单个二维图像中回归它。该方法不依赖于任何先前的人脸模型,并且可以重建全面部几何信息。与
→
PDF
6 years ago
Prev
Next