CVPRMar, 2023

CASP-Net: 从音视感官一致性角度重新思考视频显著性预测

TL;DR本研究提出了一种考虑视听语义交互和一致性感知的一致性感知音视频显著性预测网络(CASP-Net)以及用于改善不一致性的新颖一致性感知预测编码,使用多尺度音视频信息,生成显著性地图。该方法在六个具有挑战性的视听跟踪数据集上性能表现优于其他最先进的方法。