关键词image understanding
搜索结果 - 49
- VRSBench:用于遥感图像理解的通用视觉语言基准数据集PDF14 days ago
- 从我的视角看:对大型视觉 - 语言模型在图片理解中的西方文化偏见进行诊断PDF15 days ago
- 图像文本化:一种自动创建准确详细图像描述的框架PDF21 days ago
- CVPRTRINS:面向能够阅读的多模态语言模型PDF22 days ago
- TOPA: 通过文本预对齐扩展大型语言模型用于视频理解PDFa month ago
- AutoSoccerPose:足球射门动作的自动化三维姿势分析PDFa month ago
- 可解释多目标跟踪的反向神经渲染PDF2 months ago
- ViTextVQA:用于评估图像中越南文本理解的大规模视觉问答数据集PDF3 months ago
- Veagle: 多模态表征学习的进展PDF5 months ago
- Gemini: 一系列高能力的多模态模型PDF6 months ago
- LLaMA-VID: 大型语言模型中的图像抵值 2 个令牌PDF7 months ago
- 文化与语言多样性改善视觉表达PDF8 months ago
- Tree-GPT:用于森林遥感图像理解和交互分析的模块化大型语言模型专家系统PDF9 months ago
- 看见无形:对静态图像中的自动高层次视觉理解的调查PDF10 months ago
- SPAE:使用固定的 LLMs 进行多模态生成的语义金字塔自编码器PDFa year ago
- 通过特定知识注入实现预训练大型视觉模型对织物缺陷分割的有效迁移PDFa year ago
- 利用多用途特征匹配进行单次分段PDFa year ago
- ArtGPT-4: 利用适配器增强 MiniGPT-4 实现艺术视觉 - 语言理解PDFa year ago
- 可解释、具有物理感知、值得信赖的合成孔径雷达人工智能范式转变PDFa year ago
- PCRLv2:用于自监督预训练的医学图像分析统一视觉信息保护框架PDFa year ago
Prev