May, 2024

声音之图像:将图像和声音合成于单一画布上

TL;DR通过使用预训练的文本到图像和文本到频谱扩散模型,在共享潜在空间中,简单地合成具有视觉外观和声音的自然图像样本。