BriefGPT.xyz
Ask
alpha
关键词
linguistic consistency loss
搜索结果 - 1
MM
基于 CLIP 的场景文本识别的对称语言特征提取
利用对比语言图像预训练(CLIP)模型在场景文本识别(STR)中的潜力,我们建立了一个新的对称语言特征提取框架(称为 CLIP-OCR),以充分利用 CLIP 中的视觉和语言知识。通过将 CLIP 图像编码器与反转的 CLIP 文本编码器级
→
PDF
9 months ago
Prev
Next