Feb, 2021

少即是多:基于稀疏采样的 ClipBERT 视频与语言学习

TL;DR提出了一个 ClipBERT 的通用框架,通过稀疏采样实现了视频和语言任务的廉价端到端学习,该方法在多个数据集上进行的实验表明,与使用全长视频的现有方法相比,使用少量稀疏采样剪辑进行端到端学习通常更准确。