streaming mode | BriefGPT - AI 论文速递

关键词streaming mode

搜索结果 - 5

全球归一化模型的流式语音识别系统
拟稿提议使用全局标准化来解决流式模型的数学缺陷，从而缩小流式模式和前瞻模式之间的差距。全局标准化可将词错误率相对降低 9-11%。
PDFa year ago
实时语音频带扩展
本文提出了一种轻量级模型，可以将采样频率从 8kHz 提高到 16kHz，并使用 SEANet 模型结构和特征损失和对抗损失的组合方法，将高频内容恢复到与 16kHz 接近的水平，并且该模型在流模式下具有较低的延迟，可在双向语音通信系统中实
PDF4 years ago
大规模语音识别常用端到端模型比较
本研究比较了非流式和流式模式下三种端到端自动语音识别模型，包括循环神经网络转导器（RNN-T）、循环神经网络基于注意力的编码器 - 解码器（RNN-AED）和 Transformer-AED。研究表明，Transformer-AED 在流式
PDF4 years ago
移动设备上的流式关键词识别
本文研究了关键词检测模型在流媒体和非流媒体模式下在移动手机上的延迟和准确性，并通过设计了一个基于 Tensorflow/Keras 的库自动将非流媒体模型转换为流媒体模型，从而减少了手动模型重写的工作量。作者使用该库对多个关键词检测模型在流
PDF4 years ago
使用 Scout 网络的低延迟端对端流式语音识别
本文提出了一种基于 Transformer 模型的低延迟流式语音识别方法，其中包含了一个侦察网络和一个识别网络，该方法在 Librispeech 的测试数据集上实现了最佳性能 (2.7/6.4 WER) 和短暂的 639ms 延迟。
PDF4 years ago