基于注意力的语音识别编码器的普通话言语痴呆评估

Oct, 2023

基于注意力的语音识别编码器的普通话言语痴呆评估

Dementia Assessment Using Mandarin Speech with an Attention-based Speech Recognition Encoder

Zih-Jyun Lin, Yi-Ju Chen, Po-Chih Kuo, Likai Huang, Chaur-Jong Hu...

TL;DR通过训练一个基于注意力的语音识别模型并在精心设计的图片描述任务上使用，本研究构建了一个适用于普通话使用者的痴呆评估系统，通过提取语音识别模型的编码器并添加一个线性层用于痴呆评估，从 99 名被试中收集普通话语音数据并获取他们的临床评估，成功实现了 92.04% 的阿尔茨海默病检测准确率和 9% 的临床痴呆评分的平均绝对误差。

Abstract

dementia diagnosis requires a series of different testing methods, which is complex and time-consuming. Early detection of dementia is crucial as it can prevent further deterioration of the condition. This paper utilizes a speech recognition model to construct a →

dementia diagnosis speech recognition model mandarin speakers dementia assessment system alzheimer's disease detection

发现论文，激发创造

利用平行语料库进行迁移学习的中文阅读测试测评模型开发：以普通话阅读为例

该研究提出了一种方法，通过使用大量平行语料对两种语言中的工程化词汇 - 句法特征之间的对应关系进行学习，来检测阿尔茨海默病，特别是在汉语中，其性能优于单语和基于机器翻译的基线。这是第一项在检测认知衰退时转移特征域的研究。

Mar, 2019

中英文连接语言的认知评估

通过分析连接语言来评估认知功能的方法中，我们提出了一个新颖的基准数据集和预测任务。该数据集包含了普通认知的普通话和英语演讲者以及不同程度的认知损害的个体的言语样本和临床信息。我们通过倾向评分分析来仔细匹配这些数据，以确保模型训练中的平衡和代表性。预测任务包括轻度认知损害的诊断和认知测试分数的预测。我们通过提供使用语言无关和可比较特征进行诊断和认知测试分数预测的基准预测模型来说明这一框架。在诊断中，平均未加权回忆率为 59.2%，评分预测的均方根误差为 2.89。

Jun, 2024

多模态归纳迁移学习用于阿尔茨海默病及其严重程度检测

提出了一种集成声学、认知和语言特征的多模式系统，使用带时间特征的专业人工神经网络以检测阿尔茨海默病和其严重程度，并在 ADReSS 挑战数据集上获得了 83.3％的精度并在 DementiaBank Pitt 数据库上获得了 88.0％的分类精度，验证了无意识语音的通用性和可移植性。

Aug, 2020

INESC-ID 多模态系统 - ADReSS 2020 挑战赛

本文利用多模态方法，结合语音和文本特征，提出了自动检测阿尔茨海默病的分类框架，并发现语言特征对于阿尔茨海默病的分类比声学特征更为重要，能够提高分类准确率。

May, 2020

仅使用语音检测认知能力下降：ADReSSo 挑战

本文介绍了 ADReSSo Challenge 的三项预测任务，分别是：阿尔茨海默病的检测，认知测试得分的推断和认知能力下降的预测。通过从音频记录中直接提取声学和语言特征，本文开发的分类和回归模型的基准准确率分别达到了 78.87％，5.28 分的 RMSE 误差和 68.75％。

Mar, 2021

从语音和文本多模态检测阿尔茨海默病

使用多模式深度学习方法通过语音和相应的文本同时检测多种言语段落的诊断，其模型在 Dementiabank Pitt 语料库上获得了 85.3% 的准确率。

Nov, 2020

自然语言对话中的阿尔茨海默病痴呆识别： ADReSS 挑战

本文介绍了 ADReSS Challenge，它提供了一个用于比较自动识别老年痴呆症的语音的不同方法的共享任务。该挑战提供了基准的语音数据集，并定义了两个认知评估任务，即老年痴呆症语音分类任务和神经心理评分回归任务。ADReSS 旨在为语音和语言老年痴呆症研究社区提供一个综合方法比较的平台，以解决当前影响该领域的标准化缺乏问题，并为未来的研究和临床应用提供线索。

Apr, 2020

基于语用学和预训练特征的跨语言阿尔茨海默氏病检测

该研究利用 openSmile 工具包和 XLSR-53 提取声学特征，将语音转录成文本后提取语言特征进行 AD 患者检测，结果显示该方法能够通过自发性说话实现自动多语言阿尔茨海默病检测，分类准确率为 69.6%，均方根误差为 4.788。

Mar, 2023

自然语言处理技术在自发言语中预测阿尔茨海默病方面的比较

该研究使用 Spontaneous Speech 数据集文本转录，使用多种模型对 AD 和正常人的分类和预测进行训练和评估。结果表明，使用 TF-IDF 向量化器作为输入的 SVM 模型和使用 ' DistilBERT ' 的预训练模型作为简单线性模型的嵌入层的模型表现最佳，在分类指标上展示了测试集得分为 0.81-0.82 和 RMSE 为 4.58 的结果。

Jun, 2020

使用听觉、词汇、语调和停顿特征对阿尔茨海默病痴呆进行识别并抗干扰

本文介绍了两种基于多模态融合的深度学习模型，同时使用 ASR 转录的语音和声纹数据，对结构化诊断任务中的说话人是否存在阿尔茨海默病进行分类，并评估了 ADReSSo 挑战 2021 数据，其中最佳模型 BiLSTM 采用了包括单词、单词概率、口吃特征、停顿信息和各种声学特征的 highway 层，实现了 84％的准确率和 4.26 的 MMSE 认知分数预测 RSME 误差。通过使用多模态方法和单词概率、口吃和停顿信息，我们的模型在预测认知衰退时表现出了提高，并且对于使用多模态融合和门控技术进行的 AD 分类，我们展示了相当大的收益。

Jun, 2021