Mar, 2023

针对通用声音分类的无数据知识蒸馏的特征丰富的音频模型反演

TL;DR本文提出了一种名为 FRAMI 的无数据知识蒸馏框架来进行通用音频分类任务,该方法利用 Mel-spectrograms 生成高质量且具有特征丰富性的音频样本,其在音频分类上的实验表明,通过重用隐藏状态可以显着提升学生模型的准确性。