BriefGPT.xyz
大模型
Ask
alpha
关键词
waveform synthesis
搜索结果 - 3
ICML
长期节奏视频音轨器
该论文介绍了一个称为 LORIS 的新框架,用于在长期条件下生成可靠的波形,以生成与节奏视觉提示同步的音乐配乐,并扩展其模型的适用性,从舞蹈到多种体育场景,如地面练习和花样滑冰。
PDF
a year ago
利用多头卷积神经网络实现快速谱图反演
本研究提出了一种使用多头卷积神经网络(MCNN)架构从频谱生成波形的方法,而不需要迭代算法,能显著提高计算效率。对 MCNN 进行了大规模数据集的训练,并且损失函数的定义关注于声学感知质量。证明了 MCNN 是一种非常有前途的高质量语音合成
→
PDF
6 years ago
ICLR
深度语音 3:使用卷积序列学习扩展语音合成
Deep Voice 3 是一种全卷积自注意神经文本转语音系统,可以很好地匹配目前最先进的神经语音合成系统的自然度,同时训练速度快于十倍。通过在超过 2000 位演讲者的超过 800 小时的音频数据上进行训练,实现了 TTS 数据集规模的前
→
PDF
7 years ago
Prev
Next