Mar, 2024

可听地图用于音频分类器

TL;DR通过使用预训练的分类器顶部的解码器生成二进制掩码,突出显示输入音频的相关部分,这种后期诠释方法通过最大化音频的屏蔽部分上的分类器决策的可信度并最小化屏蔽部分的模型输出的概率来减小深度学习模型复杂性为音频信号的诠释提供了准确可靠且易于理解的方法。