BriefGPT.xyz
Ask
alpha
关键词
audio corpus
搜索结果 - 2
GigaSpeech: 一个拥有 10,000 小时转录音频的不断发展的多领域 ASR 语料库
本论文介绍了一个新的、多领域的英语语音识别语料库 ——GigaSpeech,它包含了来自有声读物、播客和 YouTube 等各种领域的高质量标记音频,提供了五个不同大小的训练子集,并提出了一种新的强制对齐和分割管道来创建适用于语音识别训练的
→
PDF
3 years ago
GPU 可用的模块化合成器中的十亿音频声音
该研究介绍了一个包含 10 亿个可合成声音及音频参数的多模态音频语料库,提出了一个新的基于排名的音频表示评估标准,并且采用新的综合方法,提高了合成器参数优化的精度。
PDF
3 years ago
Prev
Next