BriefGPT.xyz
Ask
alpha
关键词
video benchmark
搜索结果 - 3
视频多媒体语言模型基准测试的可扩展合成框架
VideoNIAH 是一个简单但高度可伸缩的基准构建框架,通过合成视频生成,将测试视频内容与查询 - 响应解耦,并通过插入多个不相关的图像 / 文本 ' 针' 来生成注释,从而确保视频来源的多样性和各种查询 - 响应。
PDF
23 days ago
ICCV
预测视频流媒体平台上最多重播的数据
利用深度学习模型对 YouTube 视频的 MR(Most Replayed)数据进行预测,并通过评估多个模型在 YTMR500 数据集上的性能,显示出这是困难的任务,但所有模型都优于随机预测,并且超过了人类水平准确度。鼓励研究社区使用我们
→
PDF
10 months ago
DADA-2000: 驾驶员专注度能否预测驾驶事故?通过基准测试分析
本文提出了一个新的基于驾驶员目光追踪和车祸注释的视频基准测试集(DADA-2000),涵盖了 54 种不同类型的车祸,可以更全面地预测即将发生的事故。
PDF
5 years ago
Prev
Next