零样本自动发音评估

May, 2023

Zero-Shot Automatic Pronunciation Assessment

Hongfu Liu, Mingqian Shi, Ye Wang

TL;DR提出基于 HuBERT 的零样本自动发音评估方法，使用遮罩模块破坏语音输入获取令牌序列并使用得分模块测量错误恢复的令牌数量，在 speechocean762 上得到了可比较于监督回归基线且优于非回归基线的表现，同时分析了遮罩策略对自动发音评估性能的影响。

Abstract

automatic pronunciation assessment (APA) is vital for computer-assisted language learning. Prior methods rely on annotated speech-text data to train Automatic Speech Recognition (ASR) models or speech-score data to train regression models. In this work, we propose a novel zero-shot APA

automatic pronunciation assessment computer-assisted language learning hubert transformer encoder masking strategies

发现论文，激发创造

解决数据稀缺和分布失衡问题的有效自动化口语评估方法

使用自监督学习的方法，基于测量的分类和损失重新加权的两种新模型策略，提高了自动口语评估系统的学习者语言能力预测准确性。

Apr, 2024

使用 MASK 预训练的端到端单词级发音评估

本文提出了一种名为 MPA 的简单而有效的方法，通过采用掩码预测策略，支持端到端的训练过程，可在不使用任何对齐组件的情况下进行发音评估并在很大程度上解决误对齐问题。

Jun, 2023

使用自动语音识别的零样本跨语言失语症检测

通过使用语言无关的语言特征，我们尝试利用英语中可用的数据，并在希腊语和法语等低资源语言中实现零样例失语症检测。我们提出了一种端到端流水线，使用预训练的自动语音识别（ASR）模型，共享跨语言语音表示，并进行微调，以实现我们所需的低资源语言。为了进一步提高我们的 ASR 模型的性能，我们还将其与语言模型结合在一起。我们证明，我们基于 ASR 的端到端流水线提供了与使用人工注释转录的先前设置相当的结果。

Apr, 2022

自动发音评估 - 综述

发音评估和其在计算机辅助发音训练（CAPT）中的应用近年来取得了令人瞩目的进展。本文回顾了发音评估方法在音位和韵律方面的应用，分类了主要的研究趋势中观察到的挑战，并强调了现有的限制和可用资源。接着讨论了剩余的挑战和未来工作的可能方向。

Oct, 2023

波斯幼儿语音评估的自动语音识别

介绍了一种新的针对学前儿童语音测试的方法，通过加入 Random Frequency Pitch 目标到 Wav2Vec 2.0 模型的屏蔽目标中，在 Persian CommonVoice 数据集上达到了仅有 1.35 的字错误率，并在零次和少次测试中达到了积极的成果。

Mar, 2022

计算机辅助发音训练 -- 语音合成几乎是您所需的全部

本研究提出了基于音素到音素转换、文本到语音转换和语音到语音转换三个方法来生成正确发音和发音错误的合成语音，将语音生成作为检测语音发音错误的一流方法，并在检测发音和词汇强调错误的任务中评估了这些技术，证明这些技术不仅提高了三个机器学习模型检测发音错误的准确性，而且还有助于建立该领域的新的技术标准。

Jul, 2022

自动音素转写的零样本学习

本研究使用零样本学习的方法解决语言无训练数据情况下语音转写的挑战，将语音音素分解成相应的发音属性，结合定制的声学模型，实现对目标语言中未知音素的识别，评估结果表明，该方法比传统多语言模型的平均音素误差率提高了 7.7%。

Feb, 2020

自动发音评估的新型损失函数：保留音素区分的序数回归

我们提出了一种训练基于回归的自动发音评估模型的方法，通过引入音素 - 对比次序（PCO）损失函数，从而更好地保留了音素类别之间的区分度和回归目标输出的顺序关系，并在一些现有的最先进模型上进行了可行性和有效性的实验证明。

Oct, 2023

多方面关注的层次发音评估

本研究提出了一种基于多方面注意力和分层表示的自动发音评估模型（ HiPAMA ），可在不同层次（如音素、单词和句子）上评估发音的多个方面（如准确性、流利度和完整性），从而实现更全面的反馈评估

Nov, 2022

自动后编辑的实证研究

该研究针对自动后编辑（APE）中数据稀缺的情况，通过数据增强的方式来生成大规模人工语料库构建人工数据域，以提高模型性能，报告表明高质量的人工语料库与生成的训练数据可以改善模型性能，同时在不同 MT 系统中 APE 的难度不同，模型在语法和语义添加问题上的表现良好，但容易出现实体和语义省略错误。

Sep, 2022