ICCVAug, 2021

基于支持集的跨监督视频 grounding

TL;DR本文提出了一种支持集合基的跨监督 (Sscs) 模块来改进现有的视频文本关系模型技术,该模块由辨别对比目标和生成描述目标组成,利用 support-set 概念加强互动学习,并在三个具有挑战性的数据集上获得了竞争性的结果。