关键词video question answering
搜索结果 - 69
  • i-SRT: 视频的大型多模态模型对齐通过迭代式自我回顾判断
    PDF17 days ago
  • 基于物理先验的组合式 4D 动态场景理解与视频问答
    PDFa month ago
  • 编码和控制长篇视频问答的全球语义
    PDFa month ago
  • VideoQA-SC:用于视频问答的自适应语义交流
    PDF2 months ago
  • CVPRMoReVQA: 探索视频问答的模块化推理模型
    PDF3 months ago
  • CVPRVideoDistill: 视频问答的语言感知视觉蒸馏
    PDF3 months ago
  • 零样本视频问答的问题引导视觉描述
    PDF5 months ago
  • AAAIYTCommentQA: 教学视频中的视频问题可回答性
    PDF5 months ago
  • 基于大型多模型的弱监督高斯对比定位的视频问答
    PDF5 months ago
  • AAAISTAIR: 空间 - 时序推理中间结果可审计的视频问答方法
    PDF6 months ago
  • 从确定到不确定的回答:针对视频问答的不确定性感知课程学习
    PDF6 months ago
  • 跨模态事件相关的视频问答中的推理
    PDF6 months ago
  • Vista-LLaMA: 基于视觉标记等距离的可靠视频叙述器
    PDF7 months ago
  • 用于高效长视频问答的基于检索的视频语言模型
    PDF7 months ago
  • 用稀疏输入描述视频问答
    PDF7 months ago
  • AutoEval-Video:一个用于评估开放式视频问答中大型视觉语言模型的自动化基准
    PDF7 months ago
  • EMNLP大型语言模型是视频问答中的时间和因果推理器
    PDF8 months ago
  • ATM:视频问答的动作时间建模
    PDF10 months ago
  • 通过文本理解视频场景:来自基于文本的视频问答的洞察
    PDF10 months ago
  • 抗干扰型视觉问答的无干扰嵌入
    PDF10 months ago
Prev