BriefGPT.xyz
大模型
Ask
alpha
关键词
multilingual asr
搜索结果 - 5
少即是多:准确无需 Web 规模数据的语音识别和翻译
最新的语音识别和翻译技术依赖于数十万小时的互联网语音数据。我们认为即使不依赖于互联网规模的数据,也可以达到最先进的准确性。Canary - 多语言 ASR 和语音翻译模型在英语、法语、西班牙语和德语等语言上优于当前最先进的模型 - Whis
→
PDF
4 days ago
优化端到端自动语音识别的字节级表示
我们提出了一种对字节级表示进行优化的新方法,通过使用自编码器和向量量化,在自动语音识别中实现更好的准确性。
PDF
18 days ago
ML-SUPERB 2.0:跨模型约束、语言和数据集进行多语言语音模型基准测试
ML-SUPERB~2.0 是一个新的基准系统,用于评估预训练的自监督学习和监督语音模型在下游模型、微调设置和高效模型适应方法方面的性能,它发现了 ML-SUPERB 设置的性能改进,但性能取决于下游模型设计,并且在语言和数据集之间存在大的
→
PDF
20 days ago
利用语音识别能力激发大型语言模型
通过直接添加小型音频编码器,扩展大型语言模型的能力,实现与其文本版本相同的自动语音识别系统,并在 Multilingual LibriSpeech 上的实验证明,即使在 LLM 被冻结或者音频编码器使用几乎 1 秒的步幅生成更少嵌入时,多语
→
PDF
a year ago
学习 ASR 路径:一种稀疏多语言 ASR 模型
该论文提出了一种稀疏的多语言自动语音识别模型(ASR pathways),其激活特定于语言的子网络(“路径”),从而显式地学习每种语言的参数,具有更好的性能表现。
PDF
2 years ago
Prev
Next