May, 2023

使用非负矩阵分解解决音频分类网络的可解释性问题

TL;DR本文针对音频处理网络的可解释性提出两个主要问题设置,后续解释和设计解释。其中,我们提出了一种新颖的解释器设计,结合正则化中间嵌入和预学习 NMF 字典来生成直观的基于音频的解释,以增强与网络决策相关的输入信号的最相关部分。该方法在各种分类任务(包括多标签数据,真实世界的音频和音乐等)中得到了应用。