May, 2024

利用音频频谱图视觉转换器进行异常呼吸声识别

TL;DR开发了一种名为音频 - 谱图视觉变换器的新方法,将肺部声音转化为称为谱图的可视化表示,通过使用视觉变换器模型对这些图像进行分析以识别不同类型的呼吸声,使用含有各种频率、噪声水平和背景的肺部声音的 ICBHI 2017 数据库对提出的音频 - 谱图视觉变换器方法进行了评估,并在呼吸道声音检测方面取得了 79.1% 和 59.8%(60:40 分割比)以及 86.4% 和 69.3%(80:20 分割比)的未加权平均召回率和总体分数,超过以往最先进的结果。