Jan, 2023

时间考验:让视频语言模型具有时间感

TL;DR本文旨在向已有视频语言模型注入时间感,通过后预训练等方式实现,观察经过处理后的模型在时间感知任务中的性能提升情况,并在六个数据集上进行了零样本评估。