ECCVMar, 2021

学习预测显著面孔:一种新的视听显著性模型

TL;DR本文通过建立大规模的多人面部视频音频条件下的视线跟踪数据库,研究声音对多人面部视频视觉线索的影响,并提出了一种新的多模式视频显着性模型,包括三种分支:视觉,音频和面部,实验结果表明该方法胜过 11 种现有的显着性预测方法。