基于近似最近邻短语挖掘的语境语音识别

Apr, 2023

基于近似最近邻短语挖掘的语境语音识别

Approximate Nearest Neighbour Phrase Mining for Contextual Speech Recognition

Maurits Bleeker, Pawel Swietojanski, Stefan Braun, Xiaodan Zhuang

TL;DR本文介绍了一种使用从上下文编码器的潜在空间中挖掘负短语的简单且高效的方法来训练端到端上下文感知 Transformer Transducer (CATT) 模型的扩展方法。通过包含 ANN-P (近似最近邻短语) 在上下文列表中，我们鼓励学习到的表示来区分类似但不完全相同的偏见短语，从而改善了偏见精度。在大规模数据情况下进行实验，获得了测试数据上上下文部分高达 7％的相对词误差率降低。我们还扩展和评估了 CATT 方法在流应用程序中的效果。

Abstract

This paper presents an extension to train end-to-end Context-Aware Transformer Transducer ( CATT ) models by using a simple, yet efficient method of mining hard negative phrases from the latent space of the conte

context-aware transformer transducer mining hard negative phrases latent space approximate nearest neighbour biasing accuracy

发现论文，激发创造

面向上下文的语音识别变换器转录器

本文介绍了一种基于上下文的自动语音识别系统：context-aware transformer transducer (CATT) 网络，通过多头注意力机制、编码上下文数据和使用 BERT 等技术方法，取得了比基线 transformer transducer 和现有深度上下文模型分别提高了 24.2% 和 19.4% 的词错误率性能提升。

Nov, 2021

密集文本检索的近似最近邻负对比学习

本文提出了一种新型的训练机制 --- ANCE (Approximate nearest neighbor Negative Contrastive Estimation), 它使用了一个近似最近邻索引来构建负面示例，以更好地解决稠密检索中负面实例训练不足的问题，并且通过实验证明了其在 BERT 模型上的有效性能达到了最佳效果。

Jul, 2020

基于转录器的流式语音识别中的自适应上下文偏置

提出了一个基于上下文感知的变形器转录方法的自适应上下文偏置方法，通过使用有偏的编码器和预测器嵌入来执行流媒体预测，动态地开关偏差列表，以适应个性化和常见情况，实验证明相对于基线，它可以在常见情况下减少 WER 和 CER 达到 6.7％和 20.7％，在个性化情况下对性能影响极小，同时保持快速的推理管道。

Jun, 2023

具有困难负样本的上下文语音识别

该文介绍了一种用于训练上下文机制的新方法，它使用参考文本中的专有名词和音相似的短语作为负面例子，帮助神经模型学习更具有区分度的表示，应用于端到端语音识别模型中可使单词错误率相对提高达 53.1%。

Oct, 2018

具有上下文短语预测网络的情境化端到端语音识别

本研究介绍了一种基于注意力机制的深度偏置方法中的语境短语预测网络，该网络使用上下文嵌入预测话语中的语境短语并计算偏置损失，以辅助训练文本化模型，改善了各种端到端语音识别模型的单词错误率（WER）。

May, 2023

N-Gram 最近邻机器翻译

本文提出了一种新颖的 $n$-gram 最近邻检索方法，可以提高机器翻译的精度并适用于 Autoregressive Translation 和 Non-Autoregressive Translation 模型，改进后的方法在 AT 和 NAT 模型上的平均 BLEU 分别提高了 1.03 和 2.76。

Jan, 2023

利用最近邻对比学习生成语音序列嵌入

我们介绍了一个基于自监督的音频表示的简单神经编码器架构，该架构可以使用无监督对比学习目标进行训练，并通过 k - 最近邻搜索获得它的正样本，从而可以在多个语言中应用，可用于随机语音序列的按示例查询和口头术语的发现，实验证明该方法在五种语言上显著推动了技术发展，并建立了一个基准测试以便未来监测领域的进展。

Apr, 2022

统一流式和非流式传输器中的上下文偏置的两阶段上下文单词过滤

本文提出了一种高效的方法来获取高质量的语境词列表，并将其作为上下文信息融合到非流式编码器和解码器中，以生成最终的识别结果，实验证明与基线系统相比，相对字符错误率降低了 20% 以上。

Jan, 2023

学习独立检索表示用于最近邻神经机器翻译

本文提出 kNN-MT 中耦合机器翻译任务和语料库检索任务的表示方法不够优化，对此使用对比学习进行区分，并提出一种高效的构建负样本的方法。在五个领域的实验结果表明，相比原始的 kNN-MT 方法，我们的方法提高了检索准确性和 BLEU 分数。

Sep, 2022

通过最近邻校准提高语言模型的少样本性能

本文提出了一种基于最近邻校准框架的预训练语言模型（PLMs）的上下文学习方法，该方法获得了显著的改进，并在某些情感分析任务中实现了与基于调优的方法相当的性能。

Dec, 2022