INESC-ID 多模态系统 - ADReSS 2020 挑战赛

May, 2020

INESC-ID 多模态系统 - ADReSS 2020 挑战赛

The INESC-ID Multi-Modal System for the ADReSS 2020 Challenge

Anna Pompili, Thomas Rolland, Alberto Abad

TL;DR本文利用多模态方法，结合语音和文本特征，提出了自动检测阿尔茨海默病的分类框架，并发现语言特征对于阿尔茨海默病的分类比声学特征更为重要，能够提高分类准确率。

Abstract

This paper describes a multi-modal approach for the automatic detection of alzheimer's disease proposed in the context of the INESC-ID Human Language Technology Laboratory participation in the ADReSS 2020 challen

alzheimer's disease multi-modal approach linguistic features acoustic features classification

发现论文，激发创造

从语音和文本多模态检测阿尔茨海默病

使用多模式深度学习方法通过语音和相应的文本同时检测多种言语段落的诊断，其模型在 Dementiabank Pitt 语料库上获得了 85.3% 的准确率。

Nov, 2020

基于语用学和预训练特征的跨语言阿尔茨海默氏病检测

该研究利用 openSmile 工具包和 XLSR-53 提取声学特征，将语音转录成文本后提取语言特征进行 AD 患者检测，结果显示该方法能够通过自发性说话实现自动多语言阿尔茨海默病检测，分类准确率为 69.6%，均方根误差为 4.788。

Mar, 2023

使用听觉、词汇、语调和停顿特征对阿尔茨海默病痴呆进行识别并抗干扰

本文介绍了两种基于多模态融合的深度学习模型，同时使用 ASR 转录的语音和声纹数据，对结构化诊断任务中的说话人是否存在阿尔茨海默病进行分类，并评估了 ADReSSo 挑战 2021 数据，其中最佳模型 BiLSTM 采用了包括单词、单词概率、口吃特征、停顿信息和各种声学特征的 highway 层，实现了 84％的准确率和 4.26 的 MMSE 认知分数预测 RSME 误差。通过使用多模态方法和单词概率、口吃和停顿信息，我们的模型在预测认知衰退时表现出了提高，并且对于使用多模态融合和门控技术进行的 AD 分类，我们展示了相当大的收益。

Jun, 2021

多模态归纳迁移学习用于阿尔茨海默病及其严重程度检测

提出了一种集成声学、认知和语言特征的多模式系统，使用带时间特征的专业人工神经网络以检测阿尔茨海默病和其严重程度，并在 ADReSS 挑战数据集上获得了 83.3％的精度并在 DementiaBank Pitt 数据库上获得了 88.0％的分类精度，验证了无意识语音的通用性和可移植性。

Aug, 2020

阿尔茨海默病神经任务评分建模的声学 - 语言特征

随着医疗技术、预防保健和老年健康的日益重视，全球平均寿命不断增长。因此，开发能够检测和追踪老年人群中与认知功能有关的老化相关疾病的技术至关重要。特别是，自动检测和评估阿尔茨海默病（AD）的研究具有重要性，因为该疾病的流行度以及现有方法的成本。在该研究中，我们使用自然语言处理和机器学习等技术，比较和对比了 10 种线性回归模型在 ADReSS 挑战数据集上对 Mini-Mental 状态检查得分进行预测的性能。通过使用两种方法选择的 54 种最佳特征的子集（1）递归淘汰和（2）相关性得分，我们超越了用于相同任务的最先进的基线。在评分和评估每个模型的每个所选特征子集的统计显着性时，我们发现，对于给定的任务，手工制作的语言特征比声学和学习特征更具有显着性。

Sep, 2022

比较基于声学的阿尔茨海默病检测方法

本研究使用三种不同方法（传统声学特征、预训练声学嵌入和特征和嵌入的组合）对 ADReSSo 挑战数据集上的阿尔茨海默病检测进行了研究，结果表明使用预训练嵌入的分类方法具有更高的跨验证性能和更好的泛化能力，最优模型的表现超过了基线模型 2.8%。

Jun, 2021

一种基于张量融合层的自发语音痴呆检测的多模态方法

用深度神经网络进行多模态分析调查老年痴呆症，通过在音频、文本和图像等不同模态上进行传递学习，实现了优于现有研究的准确性和 F1 得分

Nov, 2022

运用预训练语言模型，结合语言复杂度及（不）流利特征来检测阿尔茨海默病患者的自发言语

通过将语言复杂度和（不）流畅特征与预训练语言模型相结合，成功地在 2021 年 ADReSSo（阿尔茨海默病性痴呆症通过自发性言语识别）挑战赛的阿尔茨海默病检测任务中取得了 83.1% 的准确率，这是基准模型的 4.23% 的提高，并且在交叉验证和测试数据上表现出了很好的鲁棒性。

Jun, 2021

利用患者讲话转录和音频数据探索阿尔茨海默病检测的多模态方法

这项研究通过使用患者的语音和剧本数据，通过预训练语言模型和图神经网络来构建语音剧本的图，并提取特征进行阿尔茨海默病检测，同时引入音频数据和对小数据集进行增强处理，进而将音频特征与文本特征融合，最后尝试将语音剧本转化为音频进行对比学习，研究结果揭示了在使用语音和音频数据进行阿尔茨海默病检测中的挑战和潜在解决方案。

Jul, 2023

使用基于语音与基于语言的方法比较在阿尔茨海默病检测中使用 BERT 模型的必要性

这篇研究论文探讨了如何通过自然语言处理和机器学习等方法，借助 Alzheimer's disease 相关数据集，提高人类认知障碍的检测准确性，与传统检测方法相比，使用 fine-tuned BERT 模型在 Alzheimer's disease 检测任务上具有更好的表现。

Jul, 2020