BriefGPT.xyz
Ask
alpha
关键词
pre-training dataset
搜索结果 - 2
PAD:自监督预训练与红外图像的 Patchwise-Scale Adapter
该研究介绍了自主学习在红外图像领域的应用,提供了一个大规模红外预训练数据集,通过对象敏感的随机 RoI 裁剪方法和面向纹理缺失的图像预处理方法解决了传统方法在红外图像上的挑战,并引入可动态学习尺度因子的分块适配器来实现预训练特征和新特征之间
→
PDF
7 months ago
自动 GIF 字幕:用于视觉语言预训练的大规模视频句子数据集
Auto-captions on GIF 是一个新的大规模预训练数据集,可用于视频理解、视频字幕生成等下游任务的通用特征表示或编码器 - 解码器结构的预训练。通过 Auto-captions on GIF 数据集,我们还对基于 Transf
→
PDF
4 years ago
Prev
Next