Mar, 2023

先于视觉感知:一种压缩视频时序句子对齐的有效管道

TL;DR本研究针对压缩视频展开了时间句子引导的任务,并提出了一种全新的三分支压缩域空时融合框架(TCSF)来提取和聚合低级视觉特征以有效地进行时间句子引导。实验结果表明,TCSF较其他最先进的方法具有更好的性能,并具有更低的复杂度。