Dec, 2023

Audiobox: 统一音频生成的自然语言触发器

TL;DRAudiobox 是一种基于流匹配的统一模型,通过描述和示例的提示来增强可控性,统一了语音和声音生成范式,并通过使用 Bespoke Solvers 提高生成速度。