慢性肾脏疾病语音语料库
使用 50 名患者的研究,我们发现使用持续元音可以提高对慢性阻塞性肺病在语音中表现的识别准确率,从 71%的基准提高到最高 79%的无权重平均召回率,并鉴定和解释了表征 COPD 的最重要的声学特征。
Jun, 2024
使用集成学习和可解释的人工智能来视觉化慢性肾脏疾病的主要特征、特征得分和价值,提高对该疾病早期预测和检测的准确性,为临床医生开处方推荐个体患者的生活方式改变以减缓疾病进展提供帮助。
Jun, 2024
本研究提出一种新方法,使用连续的普通话语音而不是单个元音,来区分四种常见的声音障碍,并使用离散余弦变换和双向 LSTM 网络,通过大型数据库的实验表明,该方法相对于使用单个元音的系统有显著的准确度和召回率提高以及提高了系统学习声音障碍的能力。
Feb, 2022
我们在本研究中介绍了一种基于语音质量不同维度(包括音素、流利度和韵律)的综合性评分标准。通过利用 Prautocal 语料库,我们进行了两个实验,分别对音素和流利度进行评估。结果显示,评估这些现象的复杂性取决于检测到的特定类型的不流畅性,但我们观察到了积极的趋势。
Apr, 2024
开发了一个可解释的机器学习系统,用于预测有心血管风险的患者中的慢性肾脏病,在全球解释性框架、生物医学相关性和安全性评估等方面具有突出优势。
Apr, 2024
构建了第一个包含多视角信息的中文多模态情感病理性言语数据库,标记了 29 个对照组和 39 个不同程度运动性言语障碍患者表达快乐、悲伤、愤怒和中性情绪的情感言语,并通过精确度、言语可懂性、价值 - 唤醒空间分布和 SCL-90 与疾病严重程度之间的相关性等主观分析来验证其有效性。在语音和声门数据上进行的自动识别表明,对于对照组的音频,平均准确率为 78%,对于患者为 60%;对于声门数据,对照组为 51%,患者为 38%,表明疾病对情感表达的影响。
Dec, 2023
通过语音分析促进帕金森病(PD)的诊断受到缺乏公开的多样性语言数据集的限制,为了填补这一空白,我们引入了一个全面的语料库,其包括 108 名西班牙母语的巴斯克语言人中的 55 名健康对照组和 53 名被诊断为 PD 的患者,他们在药物优化状态下接受记录。这个独特的数据集涵盖了多种语音任务,包括西班牙五个元音的持续发声、对口语音测试、16 个听音重复的表达以及自由独白。这个数据集通过听音重复任务的专业手动转录加强了准确性和可靠性,同时利用 Whisper 进行了自动独白转录,成为目前最完整的公开帕金森病语音语料库,也是第一个使用西班牙巴斯克语的语料库。NeuroVoz 由 2,903 个音频录音组成,每位参与者平均有 26.88 个录音,为研究帕金森病对语音的影响提供了重要资源。该数据集已经支撑了多项研究,在 PD 语音模式识别方面达到了 89% 的基准准确率,表明了与 PD 相关的显著语音变化。尽管取得了这些进展,进行语言无关性的跨语料库分析仍然是未来研究中一个开放的领域。此研究填补了 PD 语音分析资源的重要空缺,并为全球研究社区在利用语音作为神经退行性疾病的诊断工具方面树立了新的标准。
Mar, 2024
本研究利用机器学习模型,动态识别慢性肾脏疾病患者,预测其是否需要肾脏替代治疗,可提前至一年。在研究中,我们对近三百万医保受益人进行了超过八百万次预测,证明该模型可实现超过 90%的灵敏度和特异度。该研究为筛查患者并进行早期干预以改善肾脏替代治疗成果提供了基础。
Sep, 2022
应用机器学习方法,使用 KNN Imputation 处理缺失值,采用 SMOTE 处理数据不平衡,集成多种算法,其中随机森林模型可以在不泄漏数据的情况下以 100% 的准确率检测慢性肾脏疾病。
Mar, 2022
该研究使用记忆网络和深度学习的方法,利用患者在患急性肾损伤前的结构化和非结构化电子病历数据,发现了急性肾损伤的三个亚表型,这可以更好地理解这种疾病的病理生理学并制定更有针对性的临床干预措施。
Apr, 2019