自閉症譜系障礙韓國兒童言語語料庫：朝向自動評估系統

COLINGFeb, 2024

自閉症譜系障礙韓國兒童言語語料庫：朝向自動評估系統

Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards Automatic Assessment Systems

Seonwoo Lee, Jihyun Mun, Sunhee Kim, Minhwa Chung

TL;DR本文介绍了一个专门针对韩国自闭症儿童开发的语音语料库，旨在推进发音和严重程度评估等语音技术。通过对自闭症儿童的语音和语言评估会话录音进行转录和注释，提取语音数据并分析语音和语言特征，揭示了自闭症儿童的一些与典型发育儿童或通过临床评分分类的自闭症亚组有所不同的语音和语言特征，为社交沟通严重程度和发音熟练度的自动评估系统的开发提供了潜力。

Abstract

Despite the growing demand for digital therapeutics for children with Autism Spectrum Disorder (ASD), there is currently no speech corpus available for →

digital therapeutics autism spectrum disorder speech corpus korean children speech technologies

发现论文，激发创造

自动语音识别（ASR）用于韩国儿童言语音障碍发音诊断

本研究提出了一种自动语音识别模型，旨在诊断具有言语音韵障碍（SSDs）的儿童的发音问题，以替代临床操作中的人工转录。该模型使用 wav2vec 2.0 XLS-R 模型进行改进，以识别实际发音而不是已有单词，并通过与人工标注相匹配的预测准确性达到约 90% 的水平。尽管该模型在识别不清晰发音方面仍需改进，但本研究表明 ASR 模型能够简化临床领域中的复杂发音错误诊断流程。

Mar, 2024

利用预训练语音嵌入理解 ASD 儿童的口语语言发展

本研究旨在提出使用语音处理技术进行自动化评估儿童口语发展的应用，并通过对自然语言样本分析，对使用智能辅助诊断提供了可行性，其实验结果表明 F1 宏分数分别为 82.6% 和 67.8%。

May, 2023

自闭症谱系障碍对话分析的参数选择

我们通过分析从心理学家与典型发育或患有自闭症谱系障碍（ASD）的儿童之间的诊断对话中提取的声学 / 韵律和语言特征，提出了一种 ASD 诊断的建模方法。我们比较不同特征在一系列对话任务中的贡献，并着重寻找表征患有 ASD 的儿童对话行为的最小参数集。除了分析儿童的行为外，我们还研究心理学家的对话行为是否在不同的诊断群体之间有所变化。我们的结果有助于对 ASD 儿童的对话数据进行细粒度分析，以支持诊断和干预。

Jan, 2024

语音中的自闭症识别 — 综述

通过分析来自生物医学、心理学和自然语言处理领域的研究，我们寻找能够指示自闭症的语言、韵律和声学线索。此调查涵盖了自闭症的定义、可能影响正确诊断的共病疾病，以及诸如语言流畅性、韵律特征、不流畅性和说话速度等观察结果。我们还介绍了基于词汇的方法，并描述了对音频数据和文本的机器学习和基于转换器的方法。最后，我们得出结论，目前已有大量研究，但女性患者的研究仍然非常有限，而且大多数自然语言处理研究侧重于传统的机器学习方法，而非在这一领域有潜力的转换器。另外，我们未能找到将音频和文本特征结合起来的研究。

Feb, 2024

利用机器学习探索自闭症中的言语模式障碍

通过分析检查者 - 患者对话，本研究提供一种综合方法，用于识别独特的语音模式，并利用机器学习在自闭症谱系障碍 (ASD) 的诊断过程中支持早期检测和个性化治疗规划。

May, 2024

使用自监督模型和多任务学习进行发音障碍语音的自动严重程度评估

使用自监督模型结合多任务学习的新颖自动程度评估方法在不充分的数据下对 Dysarthric 发音进行评估，该方法使用 Wav2vec 2.0 XLS-R 以及手工制作的声学特征和机器学习分类器，在 Korean dysarthric speech QoLT 数据库上相较传统基线方法提高了 1.25% 的 F1 值，并且相较于没有 ASR 头的模型提高了 10.61% 的相对百分比增长。我们还通过分析潜在表示和正则化效应来展示多任务学习如何影响重度分类表现。

Oct, 2022

编制及理论基础：一个包含中英双语儿童非母语言音频语料库

本研究介绍了一个由 50 名中英双语 5-6 岁儿童故事叙述构成的非母语英语语音语料库，提供了 6.5 个小时的儿童在英语（L2）故事理解测试中的文本、语法和发音错误的标注记录和人工评级分数。本语料库可用于第二语言教学，并有助于提高自动语音识别（ASR）的总体性能。

Apr, 2023

儿童与成人自动语音识别性能差距之桥梁

近期在自动语音识别系统（ASR）方面的最新进展，如 Whisper，已经显示出这些系统在充足的数据支持下能够接近人类水平的性能。然而，由于适合儿童的特定数据库的有限性以及儿童语音的独特特征，这一进展并不容易延伸到儿童 ASR 领域。最近的一项研究调查了利用 My Science Tutor (MyST) 儿童语音语料库提高 Whisper 在儿童语音识别方面的性能。本文在此基础上通过更高效的数据预处理提升了 MyST 数据集的实用性，同时还强调了改善儿童 ASR 性能的重要挑战。结果展示了将 Whisper 有效集成到改善儿童语音识别领域的可行性和高效性。

Sep, 2023

关于自动发音障碍语音评估可靠性的研究

自动化失语症评估可以开发低成本而有效的工具来解决手动和主观评估的当前局限，但目前的方法是否依赖于与失语症相关的说话模式或外部因素尚不清楚。本文研究噪音对记录的失语症的影响，设计并实现了一种新的方法来可视化和比较特征提取器和模型，使用 UA-Speech 数据集，旨在提高研究社区对建立可靠的自动失语症评估系统要求的认识。

Jun, 2023

增强式儿童语音识别技术的改进

儿童语音识别的表现有待提高，本研究通过对现有数据集中的儿童语音和额外的儿童说话人进行单语和跨语言转换来研究儿童间的语音转换，结果表明跨语言儿童间语音转换能显著提高儿童语音识别性能。对儿童间跨语言语音转换产生的数据量对微调自注意力模型和 Whisper 模型的影响实验结果显示，对微调自注意力模型使用两倍数据和对从头训练的模型使用六倍数据取得了最佳效果，相较于基准线而言，两者分别使词错误率 (WER) 绝对减少了约 3% 和提高了 3.6%。此外，使用少量 “高质量” 语音转换生成的数据也能取得类似最佳微调模型的效果。

Jun, 2024