关键词video understanding
搜索结果 - 169
  • 抽榨时间给移动视频理解
    PDF2 months ago
  • 检索增强型零样本视频字幕生成
    PDF2 months ago
  • 电影聊天 +: 针对长视频问答的问题感知稀疏记忆
    PDF2 months ago
  • SFMViT:慢快相遇在混沌世界中
    PDF2 months ago
  • 利用时间语境进行视频动作识别
    PDF3 months ago
  • 以意图为条件的注视导向图神经网络用于动作预测
    PDF3 months ago
  • 基于 Transformer 的人类注视行为在视频中的预测模型
    PDF3 months ago
  • MiniGPT4-Video: 提升多模态 LLM 在视频理解中的能力:交错的视觉 - 文本标记
    PDF3 months ago
  • CVPRSnAG: 视频定位的可扩展和准确性
    PDF3 months ago
  • ST-LLM:大型语言模型是有效的时间学习器
    PDF3 months ago
  • CVPROmniVid: 通用视频理解的生成框架
    PDF3 months ago
  • 长视频理解语言库
    PDF3 months ago
  • VideoAgent:一个增强记忆的多模态视频理解代理
    PDF4 months ago
  • 探索预训练的文本到视频传播模型用于视频对象分割
    PDF4 months ago
  • 视频曼巴组合套件:状态空间模型作为视频理解的多功能替代方案
    PDF4 months ago
  • VideoMamba:高效视频理解的状态空间模型
    PDF4 months ago
  • 背包里装满技能:多角度任务视角下的自我中心视频理解
    PDF4 months ago
  • MovieLLM:使用 AI 生成的影片增强长视频理解能力
    PDF4 months ago
  • 稳健视频特征提取的时空提示网络
    PDF5 months ago
  • ICLR长时嘈杂视频的多粒度对应关系学习
    PDF5 months ago