关键词vision-language datasets
搜索结果 - 5
- 通过多实例视觉提示生成器增强多模态大语言模型以实现视觉表征丰富化PDFa month ago
- DOCCI:连接和对比图像的描述PDF2 months ago
- 完美无误:改进文本到图像模型中的空间一致性PDF3 months ago
- 一幅图片胜过 77 个文本标记:对密集字幕下的 CLIP 风格模型进行评估PDF7 months ago
- 使用 Polite Flamingo 进行视觉指导调整PDFa year ago
Prev
Next