关键词large vision-language models
搜索结果 - 114
- 基于概念技能可转移性的数据选择方法用于大规模视觉语言模型PDF18 days ago
- 构建中国文化的镜头:用于理解中国谐音绘画艺术的多模态数据集PDF20 days ago
- 从像素到散文:一个大规模的密集图像字幕数据集PDF20 days ago
- VLind-Bench:大型视觉 - 语言模型中的语言先验测量PDF21 days ago
- INS-MMBench: 保险领域 LVLMs 性能综合评估的全面基准PDF21 days ago
- ACLEmbSpatial-Bench:基于大型视觉 - 语言模型的空间理解能力基准评估PDF25 days ago
- 文本引导的图像聚类PDFa month ago
- 通过合成基准评估大型视觉 - 语言模型对现实世界复杂性的理解PDFa month ago
- 用反事实推理发现大规模视觉 - 语言模型中的偏见PDFa month ago
- 大规模视觉语言模型的 Matryoshka 查询转换器PDFa month ago
- 大型视觉语言模型的白盒多模态越狱PDFa month ago
- 通过自我改进增强大型视觉语言模型中的视觉 - 语言模态对齐PDFa month ago
- VDGD:通过弥合视觉感知差距来减轻认知提示中的低可信度语言幻觉PDFa month ago
- 校准的自我奖励视觉语言模型PDFa month ago
- 揭开大型视觉语言模型的一致性之纱PDFa month ago
- UDKAG: 增强大型视觉语言模型的最新知识PDFa month ago
- IJCAIC3L: 通过对比学习生成与内容相关的视觉语言指导调参数据PDFa month ago
- 重新思考视觉语言模型中被忽视的方面PDFa month ago
- 通过级联视觉语言模型提升细粒度图像分类PDF2 months ago
- PEVA-Net: 针对零 / 少样本多视角三维形状识别的提示增强的视图聚合网络PDF2 months ago