BriefGPT.xyz
Ask
alpha
关键词
enhanced dataset
搜索结果 - 2
利用 LLaMA-3 对数十亿网络图像进行重新字幕
通过使用 LLaMA-3 构建的 recaptioning pipeline,我们提供了一个改进的数据集 Recap-DataComp-1B,可以显著改善高级视觉语言模型的训练,包括 CLIP 和 text-to-image Diffusi
→
PDF
24 days ago
ECCV
数据传输细粒度场景图生成
本文提出了一种新颖的内外数据传输( IETrans )方法来解决场景图生成的两个数据分布问题,即长尾分布和语义歧义 。通过自动创建增强的数据集,该方法为所有谓词提供了更充分和连贯的注释,从而可应用于大规模带有 1,807 个谓词类的 SGG
→
PDF
2 years ago
Prev
Next