Jul, 2023

多语种事件视频与对齐自然文本

TL;DR构建了 MultiVENT 数据集,该数据集包括多语言、以事件为中心的视频,用于分析在线新闻视频的状态,并利用其构建强大、事实准确的模型,并提供了一种用于信息检索的复杂、多语言视频检索模型作为基准。