BriefGPT.xyz
Ask
alpha
关键词
video-text correspondence
搜索结果 - 1
电影故事多语种概要:用于故事理解的数据集
构建大规模多语言视频故事数据集 M-SYMON,包含 13166 个影片摘要视频和 101.5 小时视频的精细视频文本对应注释。使用 SyMoN 人工标注数据训练的结果,在剪辑准确率和句子 IoU 得分上超过 SOTA 方法分别达到 15.
→
PDF
18 days ago
Prev
Next