关键词video understanding
搜索结果 - 168
  • InfiniBench:用于非常长视频理解的大规模多模态模型综合基准测试
    PDF4 days ago
  • VideoMambaPro:Mamba 视觉理解的重大进展
    PDF5 days ago
  • OmAgent: 复杂视频理解的多模态代理框架与任务分割
    PDF8 days ago
  • VideoHallucer:评估大型视频语言模型中的内在和外在幻觉
    PDF8 days ago
  • MMBench-Video:一种用于整体视频理解的长形多镜头基准
    PDF12 days ago
  • 走向全面的语言 - 视频表示:语言模型增强的 MSR-Video 到文本数据集
    PDF13 days ago
  • 幻觉减轻促进长期视频理解
    PDF15 days ago
  • VideoVista: 视频理解和推理的通用基准测试
    PDF15 days ago
  • 短片数据集 (SFD): 故事级视频理解的基准
    PDF18 days ago
  • 用多模态查询在视频中定位事件
    PDF18 days ago
  • 视频多媒体语言模型基准测试的可扩展合成框架
    PDF19 days ago
  • VideoGPT+: 图像和视频编码器的综合应用以提升视频理解能力
    PDF19 days ago
  • MMWorld: 视频中多学科多方面世界模型评估之路
    PDF20 days ago
  • Vript: 一部视频胜过千言万语
    PDF22 days ago
  • ShareGPT4Video: 提升视频理解与生成,优化字幕
    PDFa month ago
  • CVPR对比语言视频时间预训练
    PDFa month ago
  • 使用大型语言模型的流式长视频理解
    PDFa month ago
  • TOPA: 通过文本预对齐扩展大型语言模型用于视频理解
    PDFa month ago
  • MLLMs 的密集连接器
    PDFa month ago
  • 抽榨时间给移动视频理解
    PDF2 months ago
Prev