关键词video tasks
搜索结果 - 7
  • 多模态大型语言模型对视频片段检索的惊人有效性
    PDF8 days ago
  • VURF:视频理解的通用推理与自我完善框架
    PDF3 months ago
  • VIDiff: 多模态指令扩散模型的视频翻译
    PDF7 months ago
  • MVBench:全面多模式视频理解基准测试
    PDF7 months ago
  • 分析视觉语言模型在视频理解任务上的零样本能力
    PDF9 months ago
  • ICCVVideo OWL-ViT:视频中的时间一致性开放世界定位
    PDF10 months ago
  • 重新审视基于 CLIP 的图像到视频知识传递的时间建模
    PDFa year ago
Prev
Next