BriefGPT.xyz
大模型
Ask
alpha
关键词
transformer-transducer
搜索结果 - 3
利用时间戳信息进行序列化联合流式识别和翻译
提出了一种流式 Transformer-Transducer (T-T) 模型,能够使用单个解码器联合生成多对一和一对多的转录和翻译,并引入了一种基于时间戳信息的新颖方法来有效地在流式环境中生成语音识别和语音翻译的输出。通过在 {it, e
→
PDF
8 months ago
使用主动说话者注意力模块的端到端多讲话人音频 - 视觉自动语音识别
本文提出了一种新的终端对终端的音视频多人说话识别方法 - 视觉上下文注意力模型 (VCAM),使用可用的视频信息将解码的文本分配给多个可见面孔中的一个,具有解决多人说话建模方法中的标签歧义问题,该方法实现为基于 Transformer-Tr
→
PDF
2 years ago
基于 Transformer-RNN-Transducer 的多任务学习和联合优化语音识别
本论文探讨了 transformer-RNN-transducer 系统的多任务学习、联合优化和联合解码方法,证明了这些方法能够有效地降低字词错误率,从而保持大型文本语料库的信息。
PDF
4 years ago
Prev
Next