Jun, 2024

自然语言预训练模型在自动语音评估语音障碍中的解释

TL;DR训练和比较两种配置下的音频频谱变换器,用于语音障碍检测;应用注意力回传方法生成模型相关性图,分析模型在不同条件下的预测方式,证明随着模型微调,注意力的扩散减少,重点集中在特定音素区域。