Aug, 2023

音视类增量学习

TL;DR通过引入双通道音频-视觉相似性约束(D-AVSC)和视觉注意聚焦(VAD)的音频-视觉类增量学习方法(AV-CIL),维持音频-视觉模态之间的实例感知和类感知语义相似性,保留先前学习的音频指导训练能力,从而克服了当前方法在不断增加的类增量步骤中保持语义相似性的挑战,实验证明AV-CIL在音频-视觉类增量学习中显著优于现有的类增量学习方法。