downstream vision tasks | BriefGPT

关键词downstream vision tasks

搜索结果 - 4

从局部对比角度理解掩码自编码器
通过对编码器 - 解码器架构以及局部对比学习的分析，本文探索了 Masked AutoEncoder 的机制，并将其改进为一种局部区域级对比学习形式，为改进自监督学习框架提供了更全面和灵活的解释。
PDF9 months ago
RevColV2：探索掩蔽图像建模中的脱离关系表征
RevColV2 是一种新的架构，通过在预训练和微调过程中保留整个自编码器架构来解决预训练和微调之间表示不一致的问题，并在多个下游视觉任务中实现具有竞争力的性能。
PDF10 months ago
并非所有特征都重要：自适应先验精化增强少样本 CLIP
本文提出了一种自适应先验精细化方法 APE，通过先验精细化模块分析下游数据中的类间差异，将领域特定知识与 CLIP 提取的缓存模型分离，进而在轻量化的类别残差模块的支持下，探究测试图像、先前缓存模型和文本表示之间的三元亲和性，并通过 APE
PDFa year ago
ECCV从共享对比语言图像预训练中学习视觉表征
本篇研究探讨使用 transformer 模型进行多模态对比预训练的方法，发现优于原始的 CLIP 方法，并且支持参数量的降低，通过共享参数，实现了不同模态之间的信息交互和相近语义结构的转移。
PDF2 years ago