AAAINov, 2022

TransVCL: 带有注意力增强的视频拷贝定位网络及其灵活监督

TL;DRTransVCL 是一种注意力增强的视频复制定位网络,它通过跨序列特征引入长时序信息,利用自注意力和交叉注意力层直接优化帧级特征来精确定位视频检索应用中一对未剪辑视频内所有复制片段的位置,并在监督或半监督设置下以显著改进性能。