AAAIDec, 2021

分离声音和像素,再构建事件

TL;DR本文提出了一个基于 Event Decomposition Recomposition Network(EDRNet)框架,解决监督和弱监督下的 Audio-Visual 事件(AVE)定位问题。 在 AVE 数据集上实验表明,所提出的集体框架优于现有技术。