利用音频频谱图视觉转换器进行异常呼吸声识别

May, 2024

利用音频频谱图视觉转换器进行异常呼吸声识别

Abnormal Respiratory Sound Identification Using Audio-Spectrogram Vision Transformer

Whenty Ariyanti, Kai-Chun Liu, Kuan-Yu Chen, Yu Tsao

TL;DR开发了一种名为音频 - 谱图视觉变换器的新方法，将肺部声音转化为称为谱图的可视化表示，通过使用视觉变换器模型对这些图像进行分析以识别不同类型的呼吸声，使用含有各种频率、噪声水平和背景的肺部声音的 ICBHI 2017 数据库对提出的音频 - 谱图视觉变换器方法进行了评估，并在呼吸道声音检测方面取得了 79.1% 和 59.8%（60:40 分割比）以及 86.4% 和 69.3%（80:20 分割比）的未加权平均召回率和总体分数，超过以往最先进的结果。

Abstract

respiratory disease, the third leading cause of deaths globally, is considered a high-priority ailment requiring significant research on identification and treatment. Stethoscope-recorded lung sounds and artifici

respiratory disease lung sounds audio-spectrogram vision transformer respiratory sound detection icbhi 2017 database

发现论文，激发创造

多视角声谱图变换器用于呼吸音分类

提出了一种 Multi-View Spectrogram Transformer (MVST) 模型，将深度神经网络应用于呼吸音频谱图的分类，通过将 mel-spectrogram 分为不同大小的 patches，使用 transformer encoders 提取 patches 之间的注意力信息，并设计了一种门控融合机制来加强多视图特征，在呼吸音分类任务上明显优于现有最先进方法。

Nov, 2023

基于音频谱图变换的 Patch-Mix 对比学习在呼吸音分类中的应用

这项研究使用深度学习算法和新型增强技术，通过预处理于视听数据集上的模型实现了高效的呼吸声分类以及肺病诊断，取得了 ICBHI 数据集上 4.08% 的最高成绩。

May, 2023

基于先进信号处理与机器学习的音频呼吸疾病分类及辅助诊断支持

利用全球最大的公开医疗数据库中的呼吸声音，结合经验模式分解和谱分析等方法，训练多个机器学习模型对不同健康状况进行分类诊断，从而大大提高辅助和远程诊断能力。

Sep, 2023

基于听诊器引导的监督对比学习在呼吸音分类的跨领域适应中的应用

通过跨领域适应技术，结合监督对比学习方法，本研究在呼吸音分类领域取得了显著进展，成功减少了不同电子听诊器录制的呼吸音之间的领域依赖并实现了 61.71% 的 ICBHI 得分，相较于基线模型的 2.16% 有了显著提升。

Dec, 2023

探索基于众包呼吸音数据自动诊断 COVID-19

利用数字化技术获取身体声音进行 COVID-19 的预筛查，结果表明即使是使用简单的二进制机器学习分类器也能够正确分类健康人和 COVID-19 声音，这为进一步研究如何利用自动分析呼吸模式作为 COVID-19 预筛查信号打开了大门。

Jun, 2020

使用基于 EMD-CWT 的混合图谱的轻量级 CNN 模型，用于从肺听诊声音中检测呼吸系统疾病

本文提出了一种基于混合 CWT 和 EMD 的频谱图特征的轻量级卷积神经网络（CNN）结构，以对肺音进行疾病分析分类，与传统 VGG16 模型相比，该 CNN 模型在三元慢性分类和六类病理分类方面分别提高了 0.52％和 1.77％的准确度，并且在时间和计算复杂度上有所改进。

Sep, 2020

RepAugment：面向输入的表示层数据增强用于呼吸音分类

探索预训练语音模型在呼吸音分类中的有效性，并提出了能够处理预训练语音波形的输入不可知表示级别增广技术。实验结果表明，该方法优于 SpecAugment，在少数疾病类别的准确性上实现了显著改善，最高达到 7.14%。

May, 2024

BTS：基于元数据辅助的呼吸音分类的文本和声音模态的桥接

通过利用呼吸音样本的元数据，我们引入了一个文本 - 音频多模态模型来改进呼吸音分类的性能，并且在治疗临床环境中部分元数据不可用的情况下也进行了研究验证。

Jun, 2024

探索传统机器学习技术用于病理听诊识别

利用机器学习辨别正常和异常肺部吸气声，采用窗口和特征聚合策略，使用数据进行建模并进行决策融合，得出平均 ROC 曲线下面积为 0.691 的监督模型。

Sep, 2022

SleepVST: 使用预训练转换器从近红外视频信号进行睡眠分期

通过相机采集的生理监测进展，我们可以非接触性地测量呼吸和心脏脉搏，而这些指标可以反映出睡眠阶段的信息。因此，我们提出了 SleepVST，一种基于 Transformer 模型的睡眠分期分类方法，通过预训练和应用于视频数据，SleepVST 在睡眠分期中取得了领先的表现。

Apr, 2024