ICCVOct, 2023

基于多模态变分自编码器的音频 - 视觉分割

TL;DR通过提出的明确条件多模态变分自编码器(ECMVAE)来进行音频 - 视觉分割(AVS),从有效的表示学习的角度解决现有 AVS 方法中的问题,该方法的关键词包括明确条件多模态变分自编码器、音频 - 视觉分割、表示学习、交叉模态共享表示和音源分割。