Jul, 2023

视频探索的因果关系视频摘要器

TL;DR本文提出了基于因果关系的视频摘要器(CVS),它采用了概率编码器和概率解码器来有效地捕捉视频和查询之间的交互信息,从而提高了多模态视频摘要的精度。与现有的方法相比,CVS 的准确度提高了 5.4%,F 1 - 得分提高了 4.92%。