关键词visual-language models
搜索结果 - 21
- 在未知的动态环境中使用三维语义地图进行开放词汇的移动操作PDF8 days ago
- 从冗余到相关性:增强多模态大型语言模型的可解释性PDFa month ago
- SEP:自我增强的视觉语言模型提示调整PDFa month ago
- 探索大型基础模型在开放词汇 HOI 检测中的潜力PDF3 months ago
- ICLROpenNeRF:使用像素级特征和渲染新视图的开放式 3D 神经场景分割PDF3 months ago
- OpenGraph: 大规模户外环境中的开放词汇层次化三维图谱表示PDF4 months ago
- 文本知识的重要性:跨模态共教带来的一般化视觉类别发现PDF4 months ago
- CVPR通过上下文残差学习与少样本提示实现通用异常检测PDF4 months ago
- 基于提示的无监督领域自适应的分布对齐PDF7 months ago
- EZ-CLIP:高效零样本视频行为识别PDF7 months ago
- 图像搜索的当代艺术:通过视觉语言模型进行迭代用户意图扩展PDF7 months ago
- TCP: 面向视觉语言模型的基于文本的类别感知启发式调整PDF7 months ago
- 基于文本提示的空间协变图像配准PDF7 months ago
- VLIS: 单模态语言模型指导多模态语言生成PDF9 months ago
- 视频 CSR: 复杂视频摘要生成用于视觉 - 语言模型PDF9 months ago
- 视觉分布校准和跨模态分布对齐的小样本学习PDFa year ago
- CLIP-Count: 基于文本引导的零样本物体计数PDFa year ago
- Anything-3D: 面向野外的单视角任意物体重建PDFa year ago
- 探究大型视觉语言模型的概念理解PDFa year ago
- 机器人导航的视觉语言地图PDF2 years ago
Prev