May, 2024

DITTO-2: 音乐生成的蒸馏漫扩推理时间优化

TL;DR提出了Distilled Diffusion Inference-Time T-Optimization(DITTO-2)方法,以实现快于实时的可控音乐生成,包括音乐修补、扩展、强度、旋律和音乐结构控制,并将该方法应用于最大化文本一致性的新应用。