Apr, 2024

利用全局时间语义知识的视频句子定位

TL;DR利用伪查询特征加强领域间的联通,提高视觉和语言之间的特征对齐,以实现更好的时间句子定位。