Jul, 2023

IteraTTA: 探索使用文本提示和音频先验在生成音乐时的界面设计

TL;DR最近的文本到音频生成技术能使非专业用户自由生成音乐音频,通过尝试不同的文本提示生成音频;通过迭代比较,用户可以理解不同的文本提示和音频先验对生成结果的影响,并选择有利的音频先验,从而逐步达到松散规定的目标。