CVPRSep, 2022

从自然剧本知识中学习可转移的时空表示

TL;DR本研究提出了一种利用语义转录排序来增强可转移的时空表示学习的方法,通过将视觉模型与自然转录的语言知识结合起来,使视频模型能够在时间上建立背景并重塑叙述性的转录,从而实现在多样化数据集上表现出色。