关键词visual question-answering
搜索结果 - 13
- 长视频理解语言库PDF3 months ago
- 语言模型是否是解谜天才?算法解谜揭示多模态推理中的严峻挑战PDF4 months ago
- MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口PDF9 months ago
- ACLHaVQA: 用于豪萨语视觉问答和多模态研究的数据集PDFa year ago
- SOCRATIC QUESTIONING 的艺术:利用递归思维和自问自答进行零样本多模态推理PDFa year ago
- 通过多任务学习实现相对方向根据的全面 VQA 数据集:早期确定 “正确性” 含义PDF2 years ago
- ACLQLEVR: 一个用于量化语言和基本视觉推理的诊断数据集PDF2 years ago
- 感知得分:您的模型感知哪些数据模态?PDF3 years ago
- 使用冻结语言模型的多模式小样本学习PDF3 years ago
- ICLR迭代学习用于 VQA 中的新兴系统性PDF3 years ago
- ICLR低秩双线性池化的哈达玛积PDF8 years ago
- 开放式视觉问答PDF8 years ago
- NIPS多模态残差学习用于视觉问答PDF8 years ago
Prev
Next