INESC-ID 多模态系统 - ADReSS 2020 挑战赛
使用多模式深度学习方法通过语音和相应的文本同时检测多种言语段落的诊断,其模型在 Dementiabank Pitt 语料库上获得了 85.3% 的准确率。
Nov, 2020
该研究利用 openSmile 工具包和 XLSR-53 提取声学特征,将语音转录成文本后提取语言特征进行 AD 患者检测,结果显示该方法能够通过自发性说话实现自动多语言阿尔茨海默病检测,分类准确率为 69.6%,均方根误差为 4.788。
Mar, 2023
本文介绍了两种基于多模态融合的深度学习模型,同时使用 ASR 转录的语音和声纹数据,对结构化诊断任务中的说话人是否存在阿尔茨海默病进行分类,并评估了 ADReSSo 挑战 2021 数据,其中最佳模型 BiLSTM 采用了包括单词、单词概率、口吃特征、停顿信息和各种声学特征的 highway 层,实现了 84% 的准确率和 4.26 的 MMSE 认知分数预测 RSME 误差。通过使用多模态方法和单词概率、口吃和停顿信息,我们的模型在预测认知衰退时表现出了提高,并且对于使用多模态融合和门控技术进行的 AD 分类,我们展示了相当大的收益。
Jun, 2021
提出了一种集成声学、认知和语言特征的多模式系统,使用带时间特征的专业人工神经网络以检测阿尔茨海默病和其严重程度,并在 ADReSS 挑战数据集上获得了 83.3%的精度并在 DementiaBank Pitt 数据库上获得了 88.0%的分类精度,验证了无意识语音的通用性和可移植性。
Aug, 2020
随着医疗技术、预防保健和老年健康的日益重视,全球平均寿命不断增长。因此,开发能够检测和追踪老年人群中与认知功能有关的老化相关疾病的技术至关重要。特别是,自动检测和评估阿尔茨海默病(AD)的研究具有重要性,因为该疾病的流行度以及现有方法的成本。在该研究中,我们使用自然语言处理和机器学习等技术,比较和对比了 10 种线性回归模型在 ADReSS 挑战数据集上对 Mini-Mental 状态检查得分进行预测的性能。通过使用两种方法选择的 54 种最佳特征的子集(1)递归淘汰和(2)相关性得分,我们超越了用于相同任务的最先进的基线。在评分和评估每个模型的每个所选特征子集的统计显着性时,我们发现,对于给定的任务,手工制作的语言特征比声学和学习特征更具有显着性。
Sep, 2022
本研究使用三种不同方法(传统声学特征、预训练声学嵌入和特征和嵌入的组合)对 ADReSSo 挑战数据集上的阿尔茨海默病检测进行了研究,结果表明使用预训练嵌入的分类方法具有更高的跨验证性能和更好的泛化能力,最优模型的表现超过了基线模型 2.8%。
Jun, 2021
通过将语言复杂度和(不)流畅特征与预训练语言模型相结合,成功地在 2021 年 ADReSSo(阿尔茨海默病性痴呆症通过自发性言语识别)挑战赛的阿尔茨海默病检测任务中取得了 83.1% 的准确率,这是基准模型的 4.23% 的提高,并且在交叉验证和测试数据上表现出了很好的鲁棒性。
Jun, 2021
这项研究通过使用患者的语音和剧本数据,通过预训练语言模型和图神经网络来构建语音剧本的图,并提取特征进行阿尔茨海默病检测,同时引入音频数据和对小数据集进行增强处理,进而将音频特征与文本特征融合,最后尝试将语音剧本转化为音频进行对比学习,研究结果揭示了在使用语音和音频数据进行阿尔茨海默病检测中的挑战和潜在解决方案。
Jul, 2023
这篇研究论文探讨了如何通过自然语言处理和机器学习等方法,借助 Alzheimer's disease 相关数据集,提高人类认知障碍的检测准确性,与传统检测方法相比,使用 fine-tuned BERT 模型在 Alzheimer's disease 检测任务上具有更好的表现。
Jul, 2020