BriefGPT.xyz
Ask
alpha
关键词
multi-scale reconstruction
搜索结果 - 2
本地遮盖与逐步冻结:为自监督学习打造高效的视觉变换器
本文介绍了一种创新的自监督学习方法,将局部遮罩图像建模与渐进层冻结相结合,以增强 Vision Transformers(ViTs)中初始层训练的效率和速度。通过在训练过程中在战略点冻结特定层,我们降低了计算需求,同时保持或提高了学习能力。
→
PDF
7 months ago
CVPR
局部多尺度重建的遮盖图像建模
本文提出了一种 Masked Image Modeling(MIM)的改进方案,通过在多个不同尺度的层次上进行重构任务,显式地指导多个层次的编码器,在减小预训练负担的同时,在分类、检测和分割任务中取得可比或更好的性能。
PDF
a year ago
Prev
Next