asr models | BriefGPT - AI 论文速递

关键词asr models

搜索结果 - 25

Squeezeformer：自动语音识别的高效 Transformer
通过重新审视 Conformer 架构的设计选择，我们提出了 Squeezeformer 模型，展示其在同一训练方案下一致优于当前最先进的 ASR 模型，取得了 7.5％，6.5％和 6.0％的字错率（WER）结果，比具有相同数量的 FLO
PDF2 years ago
Vakyansh: 适用于资源稀缺的印度语言的 ASR 工具包
Vakyansh 是一个 Indic 语言语音识别端到端工具包，通过自动数据流水线实现数据创建，训练和部署，提供了适应于 18 种 Indic 语言的最先进的语音识别模型，并开放了所有这些资源来支持语音开发者社区。
PDF2 years ago
面对对抗攻击的自动语音识别模型最近的改进
改进语音识别模型的鲁棒性需要从评估攻击转向系统化评估，通过在不同架构上评估代表性的对抗性攻击，我们发现不同攻击算法的相对强度在更改模型架构时会有相当大的差异，并且某些攻击的结果不能盲目信任，自我监督预训练等培训选择可显着影响鲁棒性。
PDF2 years ago
针对大规模多语言 ASR 的端到端模型扩展
本篇研究旨在研究 15 种任务下，训练语言模型的容量瓶颈，并发现通过增加模型参数，添加深度，以及使用大型编码器等方法可以增加训练效率。
PDF3 years ago
MLS: 一个大规模的多语言语音研究数据集
本文介绍了 Multilingual LibriSpeech（MLS）数据集，这是一个大型的多语言语音研究语料库，包括 8 种语言，以及相应语言模型和基线自动语音识别模型。该数据集将在 http URL 上免费提供，我们相信它将为 ASR
PDF4 years ago