BriefGPT.xyz
大模型
Ask
alpha
关键词
synthetic audio
搜索结果 - 4
基于生成式基础模型的合成音频能辅助音频识别和语音建模吗?
最近基础模型的进展使得能够生成与音乐、事件和人类活动相关的高保真声音的音频生成模型成为可能。尽管现代音频生成模型取得了成功,但传统的音频生成质量评估方法主要依赖于类似 Frechet Audio Distance 的距离度量。相比之下,本文
→
PDF
21 days ago
从合成音频 Doppelgangers 进行对比学习
通过使用合成音频生成具有因果关系的音色、音高和时间包络变化的混合音频,我们提出了一种轻量级的方法来学习健壮的音频表示,该方法可以减轻从真实世界音频中获取大规模数据的负担,并在标准音频分类基准上取得强大的表现。
PDF
25 days ago
TTS 增强通过旋转语言何时有用?
研究聚焦在如何利用高资源语言的已训练 TTS 系统,使其产生的合成语音能提高低资源语言的 ASR 性能。结果表明,使用数千个 TTS 合成文本 - 语音对并通过平衡真实数据可得到最佳结果,但过高的 TTS 质量可能会影响 ASR 性能。在瓜
→
PDF
2 years ago
为注意力语音识别系统生成合成音频数据
本文介绍了一种利用自然语言生成的人工语音并结合于现有的自动语音识别系统中的方法,并证明仅需使用语音文本数据就可对 ASR 系统进行增强,相对于数据扩充的基线模型,本方法在 LibriSpeech-100h 上获得了高达 33% 的错误率降低
→
PDF
5 years ago
Prev
Next