语音拼贴：通过拼贴单语语料库的混合交替生成语音

Sep, 2023

语音拼贴：通过拼贴单语语料库的混合交替生成语音

Speech collage: code-switched audio generation by collaging monolingual corpora

Amir Hussein, Dorsa Zeinali, Ondřej Klejch, Matthew Wiesner, Brian Yan...

TL;DR本文介绍了一种通过拼接音频片段从单语语料库中合成 Code-Switching 数据的 Speech Collage 方法，并通过重叠添加方法提高音频生成的平滑度。我们研究了生成的数据对语音识别的影响，在使用领域内 Code-Switching 文本和合成的 Code-Switching 文本的零样本方法下，实证结果显示相对于领域内和零样本场景，混合错误率和词错误率分别降低了 34.4％和 16.2％。最后，我们证明了 Code-Switching 增强了模型的 Code-Switching 倾向并减少了其单语偏见。

Abstract

Designing effective automatic speech recognition (ASR) systems for code-switching (CS) often depends on the availability of the transcribed CS resources. To address data scarcity, this paper introduces

automatic speech recognition code-switching data synthesis speech collage cs augmentation

发现论文，激发创造

阿拉伯语 - 英语代码切换语音识别的文本数据增强

本文基于随机词汇替换和等价约束，利用对齐翻译对生成随机合法的混合语言内容进行零样本学习，以解决跨语言语音识别中数据稀缺性、语法结构复杂性和领域匹配问题，实验结果显示，所提出的方法在两个生态有效的混合语言测试集上相对降低了 65.5% 的语言模型困惑度和 7.7% 的 ASR WER，而采用等价约束的人类评估表明，80% 以上的内容质量足够。

Jan, 2022

零翻译语种混合语音识别

在零 - shot 场景下，我们提出了一种基于转写的方法，通过简化单语模块的操作并将语种转录成单一脚本，来促进有效的代码交换自动语音识别系统。该方法通过后续的双语模块来检测多语言转录点并综合外部语言模型信息，应用于端到端可微分的神经网络中，在普通话 - 英语 SEAME 测试集上证明了其有效性。

Nov, 2022

提升混合语言语音识别的声学和文本数据增强

本文提出了改进自动语音识别系统的语音和语言模型技术，用于混合语言 Frision 和 Dutch 广播语音的语音识别，通过训练包括单语及混合码的语音数据集，改善了模型效果并提高了混合语音自动识别性能。

Jul, 2018

端到端混合语音识别的数据增强

本文提出了三种针对语种转换数据的增强方法，即音频接合、TTS 和单词转换或插入生成语料，并展示了这些方法对基于端到端自动语音识别系统（ASR）的语种转换系统的性能提升，这些方法可结合近期热门技术 SpecAugment 使用，相对于没有数据增强的系统，WER 显著降低了 24.0％，相对于只有 SpecAugment 的系统还有 13.0％的收益。

Nov, 2020

大语言模型用于代码转换语音识别的生成错误校正

本文提出了一种利用大型语言模型和自动语音识别所生成的假设列表来解决语码转换的问题的方法，通过低秩适配器实现假设到转录的映射，并且实验证明该方法显著提高了语码转换自动语音识别的准确性，并且大型语言模型在数据效率方面表现出色，为低资源语言中语码转换自动语音识别的数据稀缺问题提供了潜在解决方案。

Oct, 2023

低资源方言阿拉伯语 - 英语代码切换语音语音识别系统研究

本研究使用基于 DNN 的混合和 Transformer 的端到端模型构建自动语音识别系统并通过构建系统集成方法来提高识别率，结果表明两种模型相互补充且识别性能都不错。

Aug, 2021

端到端语音识别中的语言无关代码切换

本文研究提出一种简单而有效的数据增强方法，以在缺乏大量语料库的情况下训练多语言系统，进而提高 Code-Switching 语音的自动识别水平。通过将不同源语言的音频和相应标签连结在一起训练神经网络端到端 (E2E) 模型，实现在跨句子语言转换方面的提高。

Oct, 2022

利用单语数据源训练双语和混码语音识别模型

本文介绍了一种新的聚合分词器方法，用于训练双语和混合语音自动语音识别模型，从而消除了获得语料库的限制，并演示了这种方法的有效性。

Jun, 2023

ASRU 2019 年中英混合口语识别挑战赛：公开数据集、赛道、方法与结果

该研究介绍了 ASRU 2019 普通话 - 英语代码转换语音识别挑战赛，旨在提高普通话 - 英语代码转换情况下的 ASR 性能。参与者可以使用 500 小时标准普通话语音数据和 240 小时普通话 - 英语混合语音数据。本文总结了三个跟踪中的结果以及系统性能，并讨论了模型训练和方法比较的其他细节。

Jul, 2020

为南非语言构建一体化的语码识别系统

该研究论文介绍了一种能够处理南非五种语言中发生的混合语（code-switching）的单一多语言自动语音识别系统。该系统在四个包含不同语言混合语言的语料库上进行训练，并通过语言模型的插值能够识别这五种语言的混合语，并在实验中展现出较高的准确率。

Jul, 2018