关键词multimodal reasoning
搜索结果 - 21
  • POEM:增强大型语言模型的多模态推理的交互式提示优化
    PDFa month ago
  • 多模态知识图谱下的多模态推理
    PDFa month ago
  • 一图胜过一万言:蓝图论述多模态推理的图
    PDF3 months ago
  • 单幅图像中的一切:大型多模态模型是图像学习器
    PDF4 months ago
  • BBA:大型视觉语言模型的双模行为对齐推理
    PDF4 months ago
  • 问题感知视觉变换器用于多模态推理
    PDF5 months ago
  • 多模态大型语言模型(MLLMs)的推理能力探索:多模态推理中新兴趋势的综述
    PDF6 months ago
  • 提升小型多模态推理模型的能力以与更大的模型相匹配:自一致性训练
    PDF7 months ago
  • DDCoT: 多模式语言模型中的责任区分思维链提示
    PDF8 months ago
  • 增强类人多模态推理:一项新的具有挑战性的数据集和全面框架
    PDFa year ago
  • ECHo:基于人类中心推理的事件因果推断
    PDFa year ago
  • 面向个性化人类中心的多模态推理:一项新任务
    PDFa year ago
  • MM-REACT: 多模态推理与行动的 ChatGPT 提示
    PDFa year ago
  • EMNLP面向模态的视频语料库时刻检索的伪查询生成
    PDF2 years ago
  • 将更多注意力转移至视觉主干:用于端到端视觉定位的查询调制细化网络
    PDF2 years ago
  • ECCVPACS:用于物理视听常识推理的数据集
    PDF2 years ago
  • ICCV通天塔:结合图像、语言和 3D 几何学习多模视觉
    PDF3 years ago
  • MERLOT: 多模态神经脚本知识模型
    PDF3 years ago
  • ECCVSound2Sight:从声音和上下文生成视觉动态
    PDF4 years ago
  • e-SNLI-VE: 图文蕴含纠错与自然语言解释
    PDF4 years ago
Prev