BriefGPT.xyz
Ask
alpha
关键词
text-to-music
搜索结果 - 2
使用单一非自回归变换器生成掩盖音频
我们介绍了 MAGNeT,一种遮蔽生成序列建模方法,直接操作多个音频令牌流。MAGNeT 由一个单阶段的非自回归变换器组成,在训练过程中,我们预测来自掩码调度器的遮蔽令牌跨度,而在推断过程中,我们逐步构建输出序列使用多个解码步骤。为了进一步
→
PDF
6 months ago
JEN-1: 文本引导的全局音乐生成与全方位扩散模型
JEN-1 是一个通用高保真度的文本到音乐生成模型,通过整合自回归和非自回归训练技术,并且通过上下文学习实现文本引导的音乐生成、音乐修复和延续等多种生成任务,相对于先前的方法,在文本与音乐对齐、音乐质量和计算效率方面展现出优越的性能。
PDF
a year ago
Prev
Next