May, 2023

可解释人工智能方法在语音识别中的可靠性评估 —— 以音素识别为例

TL;DR本文介绍了从图像分类领域中最新的可解释 AI 技术 “局部可解释模型 - 对抗性解释(LIME)”,应用于 TIMIT 语音数据集的语音识别任务中。将时间分割的音频片段作为解释器,本文提出的改进版本可以在其前三个音频片段中包含 96% 的真值,从而产生最可靠的解释。