May, 2023

通过脉冲响应增强实现设备鲁棒的声景分类

TL;DR通过使用预先录制的设备脉冲响应(DIR)对训练集中的音频信号进行卷积来人为增加录音设备的多样性,以解决大多数音频分类模型在泛化到不同设备录制的信号时的性能不佳问题,并成功在 Acoustic Scene Classification 任务上实现了新的最高性能。