Jan, 2024
TR-DETR: 具有任务互逆性的Transformer模型,用于联合出现时刻检索和摘要提取
TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and
Highlight Detection
TL;DR基于自然语言查询的视频时刻检索(MR)和精彩片段检测(HD)是两个高度相关的任务,目标是获取视频中的相关时刻和每个视频片段的精彩得分。本文提出了一种基于DETR的任务互补变换器(TR-DETR),专注于探索MR和HD之间的内在互补性。实验表明,TR-DETR优于现有的最先进方法。