CVPRMar, 2023

基于查询的视频表示方法:用于时刻检索和精华片段检测

TL;DR本文提出了一种针对视频检索和重点检测的检测变压器模型 Query-Dependent DETR,通过显式注入文本查询的上下文信息并利用对偶输入对提高模型对查询信息的利用能力来改进现有的变压器模型,其在 QVHighlights、TVSum 和 Charades-STA 数据集上展现出优异的性能。