BriefGPT.xyz
大模型
Ask
alpha
关键词
video-and-language inference
搜索结果 - 1
CVPR
VIOLIN:一个大规模的视频和语言推理数据集
本文介绍了一个新的任务 —— 视频与语言推理,用于联合多模态理解视频和文本,提出了一个名为 “Violin” 的大规模数据集并对其进行了分析,并对该任务进行了广泛评估。
PDF
4 years ago
Prev
Next