BriefGPT.xyz
大模型
Ask
alpha
关键词
end-to-end time-frequency domain architecture
搜索结果 - 1
基于 Conformer 的单声道音频目标说话人自动语音识别
我们提出了 CONF-TSASR,这是一种非自回归的端到端时间 - 频率域架构,用于单通道目标人说话者自动语音识别(TS-ASR)。该模型包括基于 TitaNet 的说话者嵌入模块,基于 Conformer 的掩蔽和 ASR 模块,通过联合
→
PDF
a year ago
Prev
Next