ICLRJan, 2021

LEAF: 可学习的音频分类前端

TL;DR利用可学习前端代替 mel-filterbank,可普适于语音、音乐、声音事件和动物声音信号的分类,同时在多种分类任务和 Audioset 中表现出比 mel-filterbank 更好的性能,且参数更少。