Sep, 2023

通过词级音频片段和语言学特征解释语音分类模型

TL;DR对于理解语音模型,我们引入了一种新的方法,通过在两个信息层面上对输入进行扰动,生成易于理解的解释,以揭示语音分类模型中每个与单词相关的音频片段对结果的影响,并回答 “如果我们以这种方式编辑音频信号,模型的预测结果会是什么?”。我们在英语和意大利语的两个语音分类任务上验证了我们的方法,发现解释对于模型的内在工作是准确的且对人类来说是可信的,为未来关于解释语音模型的研究铺平了道路。