BriefGPT.xyz
大模型
Ask
alpha
关键词
web-crawled datasets
搜索结果 - 2
从稀缺到高效:通过视觉丰富的标题改进 CLIP 训练
本研究关注于通过改善数据质量和数据多样性,特别强调了视觉概念与标题的整合,提出了一种用于 web 爬取数据集训练的新方法 VeCLIP,通过综合评估数据效率和模型性能,证明了 VeCLIP 在改善图片 - 文本对齐和整体模型性能方面的显著优
→
PDF
9 months ago
数据集设计与 CLIP 鲁棒性之间的交互作用:质量胜过数量
探究六种公开数据来源 ——YFCC、LAION、Conceptual Captions、WIT、RedCaps、Shutterstock—— 对 CLIP 进行预训练的分布移位是否会对性能产生影响,发现不同的预训练数据表现相差很大,并且多个
→
PDF
2 years ago
Prev
Next