BriefGPT.xyz
Ask
alpha
关键词
nemo toolkit
搜索结果 - 2
SALM: 基于语境学习的语音增强语言模型用于语音识别和翻译
我们提出了一种新颖的具有多任务和上下文学习能力的语音增强语言模型(SALM)。SALM 由一个固定的文本语言模型,一个音频编码器,一个模态适配器模块和适应语音输入和关联任务指令的 LoRA 层组成。统一的 SALM 不仅在自动语音识别(AS
→
PDF
9 months ago
RNN-Transducer 损失函数的强大可扩展 WFST 框架
本文提出了一种基于 WFST 框架的 RNN-T 损失简化开发的方案,并介绍了两种基于 WFST 的 RNN-T 实现,通过引入 W-RNNT 损失的示例说明了可扩展性优势,最终展示了 NeMo 工具包中所有实现的 RNN-T 损失。
PDF
a year ago
Prev
Next