BriefGPT.xyz
大模型
Ask
alpha
关键词
speech embedding
搜索结果 - 4
使用旁路分离器将单通道语音识别系统转换为多通道系统
本研究提出了一种基于 Sidecar 分离器的多说话人语音识别方法,旨在提高 ASR 模型在多说话人情况下的识别效果,实验结果显示该方法优于现有最先进水平。
PDF
a year ago
MM
ComParE 2022 口吃子挑战赛的端对端和自监督学习
本文提出了基于自监督学习的语音嵌入系统,通过对预先训练的 Wav2Vec2.0 模型进行嵌入提取,结合 Mel 频率倒谱系数 (MFCC) 特征进行评估,在计算语言学竞赛中达到了较好的结果,相对于 DeepSpectrum 挑战基线提高了
→
PDF
2 years ago
如何教会关键词探测器在有限的示例下发现新关键词
KeySEM 是一种基于语音嵌入的关键词识别模型,可用于个性化关键词识别,并能够在有限的示例中高效地学习新关键词,提高关键词识别的性能,这种方法适用于需要在设备上进行学习和自定义的场景。
PDF
3 years ago
使用有限和合成的语音数据训练关键词检测器
本文研究使用合成语音数据为小型的口语术语检测模型训练提取有用特征的预训练语音嵌入模型,相较于在 500 个真实示例上训练模型,只使用合成语音即可达到同等精度。
PDF
4 years ago
Prev
Next