CVPRMar, 2024

通过未标记帧利用进行音频 - 视觉分割

TL;DR在音视频分割中,我们通过利用邻近帧和远距帧的独特特征来提升性能,并通过自我训练的方式丰富数据多样性,从而发挥未标记帧的潜力。