BriefGPT.xyz
大模型
Ask
alpha
关键词
contrastive captioner
搜索结果 - 1
CoCa: 对比式字幕生成模型是图像文本基础模型
本文介绍了一种名为 CoCa 的对比式注解器,它使图像和文本的编码器和解码器能够预先训练。与标准的编码器 - 解码器变压器不同的是,在解码器的前半段中省略跨关注,以编码单模态文本表示形式,并级联其余解码器层,以便对图像编码器进行跨模态图像文
→
PDF
2 years ago
Prev
Next