关键词video tasks
搜索结果 - 7
- 多模态大型语言模型对视频片段检索的惊人有效性PDF8 days ago
- VURF:视频理解的通用推理与自我完善框架PDF3 months ago
- VIDiff: 多模态指令扩散模型的视频翻译PDF7 months ago
- MVBench:全面多模式视频理解基准测试PDF7 months ago
- 分析视觉语言模型在视频理解任务上的零样本能力PDF9 months ago
- ICCVVideo OWL-ViT:视频中的时间一致性开放世界定位PDF10 months ago
- 重新审视基于 CLIP 的图像到视频知识传递的时间建模PDFa year ago
Prev
Next