网络弯曲的扩散模型用于音视频生成

Jun, 2024

网络弯曲的扩散模型用于音视频生成

Network Bending of Diffusion Models for Audio-Visual Generation

Luke Dzwonczyk, Carmine Emanuele Cella, David Ban

TL;DR使用预训练的生成式机器学习模型，本文介绍了第一步，即创造一个工具，使艺术家能够创建音乐可视化。通过利用各种点、张量和形态学操作来进行网络弯曲，我们发现这个过程能够产生多种视觉效果，包括一些难以使用标准图像编辑工具重新创建的效果。最后，我们运用稳定扩散和网络弯曲操作，生成具有音乐响应的视频，并对某些变换对图像和基于这些变换学习稳定扩散的潜在空间的可能性进行了讨论。

Abstract

In this paper we present the first steps towards the creation of a tool which enables artists to create music visualizations using pre-trained, generative, machine learning models. First, we investigate the application of network bending, the process of applying transforms within the l

music visualizations generative machine learning models network bending image generation diffusion models music-reactive videos

发现论文，激发创造

原始音乐生成的渐进蒸馏扩散

应用一种新的深度学习方法来生成原始音频文件，并使用 1D U-Net 的渐进蒸馏扩散模型实现无条件音乐生成，并比较不同扩散参数的价值和实现。

Jul, 2023

ArchiSound: 漫射生成音频

该论文研究了扩散模型在音频生成方面的应用，提出了多种模型来满足音频生成的多方面需求，并通过简化工具库加速实时推理。

Jan, 2023

利用可微网络弯曲来攻击生成模型

我们提出了一种方法，通过在模型的中间层之间注入可训练模块，并对其进行少量的迭代训练，将生成模型的输出从原始训练分布推向新的目标，并在结果图像中展示出原始目标和新目标之间的紧张关系，以实现艺术目的。

Oct, 2023

音频驱动的预训练扩散模型生成与编辑

我们提出了一种能够在大规模图像扩散模型中实现音频条件的方法，通过将从音频剪辑中获取的特征映射到可以注入扩散模型的令牌中，引入了额外的音频 - 图像交叉注意力层，可以与扩散编辑方法相结合进行音频条件的图像编辑。

May, 2024

扩散模型与指导梯度实现可控音乐制作

我们展示了如何从扩散模型中进行条件生成，以解决音乐制作中的各种现实任务，包括音乐音频的延续、修复和再生，不同音乐轨道之间的平滑过渡以及将样式特征传递给现有音频片段。

Nov, 2023

一种适用于音视频生成的多功能扩散变压器

通过使用新的训练方法和变量扩散时间步长，我们提出了一种基于转换器的音视频潜在扩散模型，可在任务不可知的情况下进行训练，并在推理过程中实现各种音视频生成任务，克服基线模型在生成条件输入上的时间和感知上的不连贯样本的局限性。

May, 2024

艺术生成的扩散式创意探索

利用最新的扩散模型生成创意艺术，通过将文本文档与粗略草图作为辅助信息进行模型训练，取得了令人满意的实验结果。

Jul, 2023

视觉计算扩散模型的最新进展

视觉计算领域因生成人工智能的出现而快速发展，介绍了扩散模型的基本数学概念、稳定扩散模型的实现细节和设计选择，以及包括个性化、条件设定、反转等在内的这些生成人工智能工具的重要方面的综述。此外，它还对基于扩散的生成和编辑的迅速增长的文献进行了全面的概述，按照生成介质的类型进行分类，其中包括 2D 图像、视频、3D 对象、运动和 4D 场景。最后，我们讨论了可用的数据集、度量标准、开放性挑战和社会影响。这个综述为研究人员、艺术家和从业者提供了一个直观的起点来探索这个令人兴奋的主题。

Oct, 2023

基于扩散机制的生成模型

这篇文章介绍了一种基于扩散的生成模型，可用于音频和图像信号，并通过逐步像素损坏过程训练神经网络从随机噪声生成图像

Feb, 2023

冷扩散：无需噪声即可反转任意图像转换

通过改变图像退化处理方法，可以构建一系列生成模型，并且即使使用完全确定性的退化方法，也可以轻松推广扩展扩散模型的训练和测试时间更新规则，为翻转任意过程的扩散模型打下基础，这一成功也质疑了该社区对扩散模型的理解。

Aug, 2022