关键词video understanding
搜索结果 - 169
- 抽榨时间给移动视频理解PDF2 months ago
- 检索增强型零样本视频字幕生成PDF2 months ago
- 电影聊天 +: 针对长视频问答的问题感知稀疏记忆PDF2 months ago
- SFMViT:慢快相遇在混沌世界中PDF2 months ago
- 利用时间语境进行视频动作识别PDF3 months ago
- 以意图为条件的注视导向图神经网络用于动作预测PDF3 months ago
- 基于 Transformer 的人类注视行为在视频中的预测模型PDF3 months ago
- MiniGPT4-Video: 提升多模态 LLM 在视频理解中的能力:交错的视觉 - 文本标记PDF3 months ago
- CVPRSnAG: 视频定位的可扩展和准确性PDF3 months ago
- ST-LLM:大型语言模型是有效的时间学习器PDF3 months ago
- CVPROmniVid: 通用视频理解的生成框架PDF3 months ago
- 长视频理解语言库PDF3 months ago
- VideoAgent:一个增强记忆的多模态视频理解代理PDF4 months ago
- 探索预训练的文本到视频传播模型用于视频对象分割PDF4 months ago
- 视频曼巴组合套件:状态空间模型作为视频理解的多功能替代方案PDF4 months ago
- VideoMamba:高效视频理解的状态空间模型PDF4 months ago
- 背包里装满技能:多角度任务视角下的自我中心视频理解PDF4 months ago
- MovieLLM:使用 AI 生成的影片增强长视频理解能力PDF4 months ago
- 稳健视频特征提取的时空提示网络PDF5 months ago
- ICLR长时嘈杂视频的多粒度对应关系学习PDF5 months ago