用于混合代码语言模型的句法和语义特征

Oct, 2017

用于混合代码语言模型的句法和语义特征

Syntactic and Semantic Features For Code-Switching Factored Language Models

Heike Adel, Ngoc Thang Vu, Katrin Kirchhoff, Dominic Telaar, Tanja Schultz

TL;DR本研究针对语音识别中的 Code-Switching 现象，提出将语法和语义因素融入语言模型的方法，并对不同因素的效果进行了实验验证，结果显示采用 Brown 单词聚类、词性标注和开放类词语等因素可以有效减少语言模型复杂度，该最佳模型可以将错词率降低 3.4% 至 10.8%。

Abstract

This paper presents our latest investigations on different features for factored language models for code-switching speech and their effect on au

factored language models code-switching speech automatic speech recognition brown word clusters part-of-speech tags

发现论文，激发创造

使用语法感知多任务学习的代码切换语言建模

本研究提出了一种基于多任务学习的语言模型，其共享语言的语法表示，从而利用语言学信息并解决低资源数据问题，通过同时学习语言建模和语音标记来识别代码切换点的位置并改进下一个词的预测，实验表明该方法在 SEAME Phase I 和 Phase II 数据集上的困惑度分别提高了 9.7% 和 7.4%，优于基于标准 LSTM 的语言模型。

May, 2018

端到端的混合语言模型用于自动语音识别

本文利用深度双向语言模型如 BERT 和其他机器翻译模型提出了一种提取单语文本的方法，以及探索从 ASR 模型中提取混合文本的不同方法，并通过比较混杂度和其他不同指标（如 WER）的结果与标准的双语文本输出来说明模型的稳健性。

Jun, 2020

使用神经合成数据的混合语言模型来处理句子间的平行语言切换

为了解决训练混合语言模型的困难，本研究提出了一种基于序列 - 序列模型及 copy 机制的新型训练方法，通过有限的混合语言数据和单语数据的并行翻译生成需要的混合语言数据，且无需对齐或分析，实现了良好的表现，并显著提高了末端自动语音识别。

Sep, 2019

用合成的混合语文本生成优化双语神经转换器

本研究探讨了如何针对混杂语音优化基于神经传递器的双语自动语音识别系统，发现半监督训练和合成的混合开关数据可以改善这一系统的性能。同时，我们分析了每个神经传递器编码器对混合开关性能的影响，并在 ASCEND 数据集上评估了我们的英语 / 普通话系统，其混合错误率为 25％，较文献节省 2.1％，同时保持好的单语测试集准确性。

Oct, 2022

利用语言识别计算中间 CTC 损失以增强代码交替语音识别

通过在自动语音识别模型的编码器的中间层引入语言识别信息，本文旨在以更加隐式的方式生成暗示语言区别的声学特征，降低模型在处理语言切换时的混淆。

Dec, 2023

使用预训练多语言嵌入和分词技术的混合语种文本情感分类

本论文提出一种自然语言处理算法，利用混合文本中的语码切换点，用基于大型预训练多语言模型的语义相似性和人工制作的积极和消极词汇集来确定语码切换文本的极性，以实现情感分析，其准确性和 F1 分数较基准模型提高了 11.2% 和 11.64%。

Oct, 2022

多语音识别中的代码切换适配器适应

本文提出了在代码转换的语音中有效地微调大型预训练多语言语音模型的方法，并将代码转换建模为一系列潜在的二进制序列，以引导每个语言适配器在帧级别上的信息流，通过在阿拉伯语、普通话和印地语等多种语言与英语配对的数据集上的评估，显示出代码转换性能的持续改进，至少可以将语音识别错误率 (CER) 降低 10％。

Oct, 2023

利用编码解耦的有效混合专家方法进行代码切换语音识别

通过引入一种新的解缠损失函数，本研究专注于改进端到端自动语音识别（ASR）的声学编码器，以解决代码切换现象带来的挑战，并通过实验验证了该方法的优越性。

Feb, 2024

实现端到端的代码交替语音识别

本文通过混合 CTC-Attention 模型，不同建模单元，语言识别以及不同解码策略等对汉英混合口语识别任务进行了研究，并在 SEAME 语音库上实现了 34.24% 的混淆误差率。

Oct, 2018

0-shot 多语言语音合成的音韵特征

本研究研究了如何利用国际音标中若干语音学特征，在单语言模型的基础上实现不同语言的代码切换的语音识别，从而生成在新语言中可懂的语音。

Aug, 2020