ICMLJun, 2024

AND:用于解释深度声音的音频网络解剖学

TL;DR介绍了 AND,第一个通过高响应音频自动建立自然语言解释的声学神经元的声学网络解剖框架,并通过大量实验证实了 AND 的准确和信息丰富的描述。同时,展示了 AND 在声音机器遗忘方面的潜在用途,通过基于生成的描述进行概念特定剪枝。最后,通过 AND 分析了两种声学模型行为:模型使用基本声学特征而非高层抽象概念来区分音频,训练策略影响模型行为和神经元的可解释性,有监督训练逐渐引导神经元狭窄注意力,而自监督学习鼓励神经元具有多语义性以探索高层特征。