关键词visual question-answering
搜索结果 - 13
  • 长视频理解语言库
    PDF3 months ago
  • 语言模型是否是解谜天才?算法解谜揭示多模态推理中的严峻挑战
    PDF4 months ago
  • MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口
    PDF9 months ago
  • ACLHaVQA: 用于豪萨语视觉问答和多模态研究的数据集
    PDFa year ago
  • SOCRATIC QUESTIONING 的艺术:利用递归思维和自问自答进行零样本多模态推理
    PDFa year ago
  • 通过多任务学习实现相对方向根据的全面 VQA 数据集:早期确定 “正确性” 含义
    PDF2 years ago
  • ACLQLEVR: 一个用于量化语言和基本视觉推理的诊断数据集
    PDF2 years ago
  • 感知得分:您的模型感知哪些数据模态?
    PDF3 years ago
  • 使用冻结语言模型的多模式小样本学习
    PDF3 years ago
  • ICLR迭代学习用于 VQA 中的新兴系统性
    PDF3 years ago
  • ICLR低秩双线性池化的哈达玛积
    PDF8 years ago
  • 开放式视觉问答
    PDF8 years ago
  • NIPS多模态残差学习用于视觉问答
    PDF8 years ago
Prev
Next