Nov, 2023

全景视频的视听显著性

TL;DR建立了最大的音频-视觉全景视频显著性数据集(AVS-ODV),分析了观察者在不同音频模式和视觉场景下的视觉注意行为,并构建了一个新的基准模型和数据集以促进未来的研究。