BriefGPT.xyz
Ask
alpha
关键词
web audio data
搜索结果 - 1
VoxLingua107:一个口语识别数据集
本文研究了利用网络音频数据自动识别口语语言的任务。通过从特定语言的 Wikipedia 数据中生成半随机搜索短语,并从 YouTube 中检索视频来提取具有语音的视频片段,并使用语音活动检测和说话人分离提取包含语音的视频片段,最终构建了可用
→
PDF
4 years ago
Prev
Next