Jul, 2020

复杂查询视频检索的树增强交叉模态编码

TL;DR本文提出了一种基于Tree-augmented Cross-modal Encoding的方法,用于结合学习查询的语言结构和视频的时间特征进行视频检索,以实现更好的视频检索性能。