关键词video understanding
搜索结果 - 168
- InfiniBench:用于非常长视频理解的大规模多模态模型综合基准测试PDF4 days ago
- VideoMambaPro:Mamba 视觉理解的重大进展PDF5 days ago
- OmAgent: 复杂视频理解的多模态代理框架与任务分割PDF8 days ago
- VideoHallucer:评估大型视频语言模型中的内在和外在幻觉PDF8 days ago
- MMBench-Video:一种用于整体视频理解的长形多镜头基准PDF12 days ago
- 走向全面的语言 - 视频表示:语言模型增强的 MSR-Video 到文本数据集PDF13 days ago
- 幻觉减轻促进长期视频理解PDF15 days ago
- VideoVista: 视频理解和推理的通用基准测试PDF15 days ago
- 短片数据集 (SFD): 故事级视频理解的基准PDF18 days ago
- 用多模态查询在视频中定位事件PDF18 days ago
- 视频多媒体语言模型基准测试的可扩展合成框架PDF19 days ago
- VideoGPT+: 图像和视频编码器的综合应用以提升视频理解能力PDF19 days ago
- MMWorld: 视频中多学科多方面世界模型评估之路PDF20 days ago
- Vript: 一部视频胜过千言万语PDF22 days ago
- ShareGPT4Video: 提升视频理解与生成,优化字幕PDFa month ago
- CVPR对比语言视频时间预训练PDFa month ago
- 使用大型语言模型的流式长视频理解PDFa month ago
- TOPA: 通过文本预对齐扩展大型语言模型用于视频理解PDFa month ago
- MLLMs 的密集连接器PDFa month ago
- 抽榨时间给移动视频理解PDF2 months ago
Prev