面向东南亚语言的云自动语音识别系统

Oct, 2022

面向东南亚语言的云自动语音识别系统

Cloud-based Automatic Speech Recognition Systems for Southeast Asian Languages

Lei Wang, Rong Tong, Cheung Chi Leung, Sunil Sivadas, Chongjia Ni...

TL;DR介绍我们为东南亚语言开发的自动语音识别系统，以印尼语和泰语为例解释了收集语音和文本资源所需的各种策略。

Abstract

This paper provides an overall introduction of our Automatic Speech Recognition (ASR) systems for southeast asian languages. As not much existing work has been carried out on such regional languages, a few difficulties should be addressed before building the systems: limitation on spee

automatic speech recognition southeast asian languages resources bahasa indonesia thai

发现论文，激发创造

无监督自动语音识别：综述

这篇论文研究了使用无监督学习的方法，包括语音分割，语音信号到文本的映射和半监督模型来实现自动语音识别，以识别从语音数据中可以学到的极限并理解语音识别的最小要求，目的是为了在开发低资源语言的语音识别系统时优化资源和努力。

Jun, 2021

重音语音识别综述

该研究论文探讨了自动语音识别（ASR）系统在不同语音口音上的普适性问题，分析了当前最有前景的口音识别方法，并强调了其中的关键挑战。

Apr, 2021

基于 Wav2Vec2 和迁移学习的孟加拉语自动语音识别系统

本文旨在利用基于迁移学习框架的端到端语音识别技术，提高孟加拉语的语音识别性能，并在使用仅 1000 个训练样本进行训练的情况下，在测试数据集上实现了 3.819 的 Levenshtein Mean Distance 得分。

Sep, 2022

自动语音识别系统 —— 印地语

自动语音识别（ASR）是计算语言学的一个关键领域，主要研究开发能够使计算机将口语转换为文本的技术。该研究聚焦于开发基于 JavaScript 和 Node.js 的网络应用程序和语音识别的网络界面，使用监督学习训练改善语音识别的神经网络，并设计对声音信号进行准确对齐的新型反向传播方法。

Jun, 2024

尼泊尔自动语音识别系统现状的综合研究

我们在这篇论文中研究了尼泊尔自动语音识别领域的研究。我们的主要目标是对迄今为止在尼泊尔自动语音识别系统上的工作进行全面回顾，探索使用的不同数据集，研究所采用的技术，并考虑在实现尼泊尔语自动语音识别系统时遇到的障碍。与基于语音识别的全球趋势相协调，尼泊尔与自动语音识别相关的项目数量也在增加。然而，与资源充足的语言相比，尼泊尔语的语言和声学模型的研究并没有得到足够的关注。在这种情况下，我们提供一个框架和未来研究的方向。

Feb, 2024

基于深度语音的印度英语口音端到端自动语音识别（ASR）

本研究使用转移学习和数据增强方法，对最近的 Deep Speech 模型（deepspeech-0.9.3）进行 fine-tuning，以开发一个适用于印度英语口音的端到端语音识别系统，并与其他可用的印度英语口音识别服务进行了比较。

Apr, 2022

孟加拉语生物医学数据的自动语音识别

该研究提出了一个专门针对孟加拉生物医学数据开发的自动语音识别（ASR）原型系统。该系统针对孟加拉语和西利特语两种重要方言，培训和评估了两个流行的 ASR 框架，旨在为数字健康应用创建可部署的健康领域 ASR 系统，从而提高非技术用户在医疗保健领域的可访问性。

Jun, 2024

启用低资源语言的 ASR：一个全面的数据集创建方法

本研究介绍了一种用于从有声读物生成 ASR 训练数据集的新型流程，以应对资源稀缺语言中自动语音识别系统性能较差的问题。该方法通过有效地对齐音频和相应的文本，并将其分割成适合 ASR 训练的长度，简化了资源稀缺语言中 ASR 系统的数据准备工作，并通过对亚美尼亚语的案例研究证明了其应用价值。这种方法可以适用于许多资源稀缺语言，不仅解决了数据匮乏问题，还提高了低资源语言的 ASR 模型性能。

Jun, 2024

在超低资源环境下创建口语对话系统

自动语音识别（ASR）系统是一项关键技术，用于设计各种应用程序，尤其是智能助手，如 Alexa。本文着重于低资源语言 Flemish 的 Intent 分类任务，通过在语音级别和音素转录级别应用不同的数据增强技术，改进了现有模型的性能。

Dec, 2023

对话语言的自动语音识别系统评估：语言学视角

本文以法语为案例研究，从语言学的角度探讨自动语音识别系统在复杂语境下的识别准确度，并解决了法语同音词的歧义问题，提高了法语语音转写准确度。

Nov, 2022