BriefGPT.xyz
Ask
alpha
关键词
token-level serialized output training
搜索结果 - 2
使用令牌级别的说话人嵌入进行分配流式讲话者自动语音识别
提出了一种基于 token 级别序列化输出训练 (t-SOT) 的流式说话者归属性自动语音识别 (SA-ASR) 模型,该模型可以在多人同时说话时实现低延迟的 “谁说了什么” 的识别,并提出了一种基于编码 - 解码的说话者嵌入提取器,可以从
→
PDF
2 years ago
使用令牌级串行化输出训练的流式多说话人 ASR
本文提出了一种基于 token 级别序列化输出训练(t-SOT)的新型流式多说话人自动语音识别框架,该框架在 LibriSpeechMix 和 LibriCSS 数据集中显示出比以前的结果更高的单词错误率的优势。
PDF
2 years ago
Prev
Next