基于注意力的语音识别编码器的普通话言语痴呆评估
该研究提出了一种方法,通过使用大量平行语料对两种语言中的工程化词汇 - 句法特征之间的对应关系进行学习,来检测阿尔茨海默病,特别是在汉语中,其性能优于单语和基于机器翻译的基线。这是第一项在检测认知衰退时转移特征域的研究。
Mar, 2019
通过分析连接语言来评估认知功能的方法中,我们提出了一个新颖的基准数据集和预测任务。该数据集包含了普通认知的普通话和英语演讲者以及不同程度的认知损害的个体的言语样本和临床信息。我们通过倾向评分分析来仔细匹配这些数据,以确保模型训练中的平衡和代表性。预测任务包括轻度认知损害的诊断和认知测试分数的预测。我们通过提供使用语言无关和可比较特征进行诊断和认知测试分数预测的基准预测模型来说明这一框架。在诊断中,平均未加权回忆率为 59.2%,评分预测的均方根误差为 2.89。
Jun, 2024
提出了一种集成声学、认知和语言特征的多模式系统,使用带时间特征的专业人工神经网络以检测阿尔茨海默病和其严重程度,并在 ADReSS 挑战数据集上获得了 83.3%的精度并在 DementiaBank Pitt 数据库上获得了 88.0%的分类精度,验证了无意识语音的通用性和可移植性。
Aug, 2020
本文利用多模态方法,结合语音和文本特征,提出了自动检测阿尔茨海默病的分类框架,并发现语言特征对于阿尔茨海默病的分类比声学特征更为重要,能够提高分类准确率。
May, 2020
本文介绍了 ADReSSo Challenge 的三项预测任务,分别是:阿尔茨海默病的检测,认知测试得分的推断和认知能力下降的预测。通过从音频记录中直接提取声学和语言特征,本文开发的分类和回归模型的基准准确率分别达到了 78.87%,5.28 分的 RMSE 误差和 68.75%。
Mar, 2021
使用多模式深度学习方法通过语音和相应的文本同时检测多种言语段落的诊断,其模型在 Dementiabank Pitt 语料库上获得了 85.3% 的准确率。
Nov, 2020
本文介绍了 ADReSS Challenge,它提供了一个用于比较自动识别老年痴呆症的语音的不同方法的共享任务。该挑战提供了基准的语音数据集,并定义了两个认知评估任务,即老年痴呆症语音分类任务和神经心理评分回归任务。ADReSS 旨在为语音和语言老年痴呆症研究社区提供一个综合方法比较的平台,以解决当前影响该领域的标准化缺乏问题,并为未来的研究和临床应用提供线索。
Apr, 2020
该研究利用 openSmile 工具包和 XLSR-53 提取声学特征,将语音转录成文本后提取语言特征进行 AD 患者检测,结果显示该方法能够通过自发性说话实现自动多语言阿尔茨海默病检测,分类准确率为 69.6%,均方根误差为 4.788。
Mar, 2023
该研究使用 Spontaneous Speech 数据集文本转录,使用多种模型对 AD 和正常人的分类和预测进行训练和评估。结果表明,使用 TF-IDF 向量化器作为输入的 SVM 模型和使用 ' DistilBERT ' 的预训练模型作为简单线性模型的嵌入层的模型表现最佳,在分类指标上展示了测试集得分为 0.81-0.82 和 RMSE 为 4.58 的结果。
Jun, 2020
本文介绍了两种基于多模态融合的深度学习模型,同时使用 ASR 转录的语音和声纹数据,对结构化诊断任务中的说话人是否存在阿尔茨海默病进行分类,并评估了 ADReSSo 挑战 2021 数据,其中最佳模型 BiLSTM 采用了包括单词、单词概率、口吃特征、停顿信息和各种声学特征的 highway 层,实现了 84% 的准确率和 4.26 的 MMSE 认知分数预测 RSME 误差。通过使用多模态方法和单词概率、口吃和停顿信息,我们的模型在预测认知衰退时表现出了提高,并且对于使用多模态融合和门控技术进行的 AD 分类,我们展示了相当大的收益。
Jun, 2021