使用听觉、词汇、语调和停顿特征对阿尔茨海默病痴呆进行识别并抗干扰

Jun, 2021

使用听觉、词汇、语调和停顿特征对阿尔茨海默病痴呆进行识别并抗干扰

Alzheimer's Dementia Recognition Using Acoustic, Lexical, Disfluency and Speech Pause Features Robust to Noisy Inputs

Morteza Rohanian, Julian Hough, Matthew Purver

TL;DR本文介绍了两种基于多模态融合的深度学习模型，同时使用 ASR 转录的语音和声纹数据，对结构化诊断任务中的说话人是否存在阿尔茨海默病进行分类，并评估了 ADReSSo 挑战 2021 数据，其中最佳模型 BiLSTM 采用了包括单词、单词概率、口吃特征、停顿信息和各种声学特征的 highway 层，实现了 84％的准确率和 4.26 的 MMSE 认知分数预测 RSME 误差。通过使用多模态方法和单词概率、口吃和停顿信息，我们的模型在预测认知衰退时表现出了提高，并且对于使用多模态融合和门控技术进行的 AD 分类，我们展示了相当大的收益。

Abstract

We present two multimodal fusion-based deep learning models that consume ASR transcribed speech and acoustic data simultaneously to classify whether a speaker in a structured diagnostic task has Alzheimer's Disease and to what degree, evaluating the →

multimodal fusion-based deep learning models asr transcribed speech alzheimer's disease classification acoustic features adresso challenge

发现论文，激发创造

INESC-ID 多模态系统 - ADReSS 2020 挑战赛

本文利用多模态方法，结合语音和文本特征，提出了自动检测阿尔茨海默病的分类框架，并发现语言特征对于阿尔茨海默病的分类比声学特征更为重要，能够提高分类准确率。

May, 2020

从语音和文本多模态检测阿尔茨海默病

使用多模式深度学习方法通过语音和相应的文本同时检测多种言语段落的诊断，其模型在 Dementiabank Pitt 语料库上获得了 85.3% 的准确率。

Nov, 2020

运用预训练语言模型，结合语言复杂度及（不）流利特征来检测阿尔茨海默病患者的自发言语

通过将语言复杂度和（不）流畅特征与预训练语言模型相结合，成功地在 2021 年 ADReSSo（阿尔茨海默病性痴呆症通过自发性言语识别）挑战赛的阿尔茨海默病检测任务中取得了 83.1% 的准确率，这是基准模型的 4.23% 的提高，并且在交叉验证和测试数据上表现出了很好的鲁棒性。

Jun, 2021

运用基于 ASR 的转录进行阿尔茨海默病分类：探究标点符号和停顿的影响

本研究使用最新的自动语音识别技术，研究如何应用暂停符号和自动标点符号进行阿尔茨海默病分类，实验结果表明，这两种技术与手工转录结合可有效识别阿尔茨海默病。

Jun, 2023

基于语用学和预训练特征的跨语言阿尔茨海默氏病检测

该研究利用 openSmile 工具包和 XLSR-53 提取声学特征，将语音转录成文本后提取语言特征进行 AD 患者检测，结果显示该方法能够通过自发性说话实现自动多语言阿尔茨海默病检测，分类准确率为 69.6%，均方根误差为 4.788。

Mar, 2023

一种基于张量融合层的自发语音痴呆检测的多模态方法

用深度神经网络进行多模态分析调查老年痴呆症，通过在音频、文本和图像等不同模态上进行传递学习，实现了优于现有研究的准确性和 F1 得分

Nov, 2022

利用患者讲话转录和音频数据探索阿尔茨海默病检测的多模态方法

这项研究通过使用患者的语音和剧本数据，通过预训练语言模型和图神经网络来构建语音剧本的图，并提取特征进行阿尔茨海默病检测，同时引入音频数据和对小数据集进行增强处理，进而将音频特征与文本特征融合，最后尝试将语音剧本转化为音频进行对比学习，研究结果揭示了在使用语音和音频数据进行阿尔茨海默病检测中的挑战和潜在解决方案。

Jul, 2023

多模态归纳迁移学习用于阿尔茨海默病及其严重程度检测

提出了一种集成声学、认知和语言特征的多模式系统，使用带时间特征的专业人工神经网络以检测阿尔茨海默病和其严重程度，并在 ADReSS 挑战数据集上获得了 83.3％的精度并在 DementiaBank Pitt 数据库上获得了 88.0％的分类精度，验证了无意识语音的通用性和可移植性。

Aug, 2020

阿尔茨海默病神经任务评分建模的声学 - 语言特征

随着医疗技术、预防保健和老年健康的日益重视，全球平均寿命不断增长。因此，开发能够检测和追踪老年人群中与认知功能有关的老化相关疾病的技术至关重要。特别是，自动检测和评估阿尔茨海默病（AD）的研究具有重要性，因为该疾病的流行度以及现有方法的成本。在该研究中，我们使用自然语言处理和机器学习等技术，比较和对比了 10 种线性回归模型在 ADReSS 挑战数据集上对 Mini-Mental 状态检查得分进行预测的性能。通过使用两种方法选择的 54 种最佳特征的子集（1）递归淘汰和（2）相关性得分，我们超越了用于相同任务的最先进的基线。在评分和评估每个模型的每个所选特征子集的统计显着性时，我们发现，对于给定的任务，手工制作的语言特征比声学和学习特征更具有显着性。

Sep, 2022

通过特征选择和声学词袋模型鉴别口语语言中的认知衰退

记忆障碍是老年人功能和日常活动衰退的核心因素。该研究采用自动特征选择和机器学习技术，通过语音分析来诊断认知能力下降和痴呆症患者，取得了高于国际研究水平的分类准确度。

Feb, 2024