关键词multimodal knowledge
搜索结果 - 9
- 将隐式多模态知识融入到零资源对话生成中的 L-LMsPDF2 months ago
- 感知,对话,然后适应:用于开放世界视频识别的基础模型的多模态知识传递PDF4 months ago
- 基于大型语言模型的知识导向视觉问答中的模态感知集成PDF4 months ago
- M2K-VDG: 模型自适应多模态知识锚定增强的视频驱动对话生成PDF4 months ago
- 知识图谱支持的篮球基准测试和视频字幕PDF5 months ago
- MineDojo:基于互联网规模知识构建开放式具身代理PDF2 years ago
- ICLR视觉增强语言建模PDF2 years ago
- CVPRMuKEA: 基于多模态知识提取和累积的基于知识的视觉问答PDF2 years ago
- 从视觉到语言的知识迁移:如何实现和衡量?PDF3 years ago
Prev
Next