BriefGPT.xyz
Mar, 2024
长文本CLIP: 解锁CLIP的长文本能力
Long-CLIP: Unlocking the Long-Text Capability of CLIP
HTML
PDF
Beichen Zhang, Pan Zhang, Xiaoyi Dong, Yuhang Zang, Jiaqi Wang
TL;DR
通过引入Long-CLIP作为CLIP的替代方案,本研究提供了一种支持长文本输入的方法,并保持了零样本泛化能力,提高了长标题文本-图像检索和传统文本-图像检索任务的性能。
Abstract
contrastive language-image pre-training
(
clip
) has been the cornerstone for
zero-shot classification
,
→