Sep, 2023

音视少样本学习的文本特征传播

TL;DR通过少量标记数据进行音视频数据的深度学习模型训练是一种更经济的方式,本研究提出了一种统一的音视频少样本视频分类基准,通过跨模态注意力融合时空和音视觉特征,并为新类别生成多模态特征,最终获得了最先进的音视频少样本学习表现。