通过修改 DDIM,我们的方法在 3D 生成中消除了过度平滑,保留了高频细节,并使生成质量接近于 2D 采样器,从而取得了与其他先进的分数蒸馏方法相当或更好的 3D 生成质量,而无需训练额外的神经网络或多视图监督,并为扩散模型中 2D 和 3D 资源生成之间的关系提供有用的见解。
May, 2024
通过最优成本传输路径的观点,我们提出了一种新的方法,通过校准源分布的文本条件,可以在许多领域中产生高质量的生成和翻译结果,并击败专用方法的性能。
Jun, 2024
通过 DDIM 生成过程的类似 SDS 损失的表达方式,本论文发现 SDS 可以看作是一种广义的 DDIM 生成过程,结合创新的噪声抽样方法和流分数蒸馏(FSD)方法,实验证明 FSD 方法显著增强了生成的多样性而不损害质量。
通过定量评估指标、交叉验证人类评级以及分析 SDS 技术的失败案例,我们提出了一种新的计算效率基准模型,以解决生成模型中的艺术问题,包括 3D 模型准确性和文本提示之间的错位问题,并在所提出的评估指标上达到了最先进的性能。
Feb, 2024
通过对 Score Distillation Sampling(SDS)进行解释,我们揭示了其作为三个功能组成部分 —— 模式分离、模式寻找和方差降低的组合,并分析了每个组成部分的特性。在此基础上,我们提出了一种名为稳定评分蒸馏(SSD)的简单而有效的方法,有效地协调每个组成部分,实现高质量的 3D 内容生成。大量实验证实了我们方法的有效性,即使在最具挑战性的 NeRF 表示下,也能生成高保真度的 3D 内容而不会出现过度平滑和过度饱和等问题。
Dec, 2023
通过解释 Score Distillation Sampling (SDS) 过程中存在的一个不需要的噪声项的蒸馏的必要性,本文提出了一种新的无噪声评分蒸馏(NFSD)过程,通过极少的修改实现了对预训练文本到图像扩散模型的更有效蒸馏。
Oct, 2023
通过引入 GSD 框架,将三维一致性和几何意识融入 SDS 过程,该方法显著提高了性能,在文本到三维生成任务中成功解决了几何不一致性问题,并与现有的基于分值蒸馏的模型兼容。
通过分析分数蒸馏抽样(SDS)及其变体,我们发现其蒸馏抽样过程实际上对应于随机微分方程(SDE)的轨迹抽样,这启发我们提出了一种新颖有效的 “Consistent3D” 方法,该方法通过确定性抽样先验来进行文本到三维生成。实验结果表明,Consistent3D 在生成高保真度和多样性的三维物体和大规模场景方面具有很高的效能。
Jan, 2024
在文本到 3D 生成领域,通过得分提取采样 (SDS) 使用的 2D 扩散模型经常导致模糊外观和多面几何等问题,本研究通过分析发现这些挑战的核心是 2D 扩散过程中噪声水平、扩散网络架构和 3D 模型表示之间的相互作用,在这些局限上,我们提出了 StableDreamer,它包含了三个新进展,通过此方法能够解决多面几何问题、生成高保真的 3D 模型并且稳定收敛。
现有的分数蒸馏方法对于分类器无关指导(CFG)的尺度非常敏感,表现为小的 CFG 尺度上的过度平滑或不稳定,而在大的尺度上过饱和。本文提出了对抗性分数蒸馏 (ASD) 方法,它使用可优化的鉴别器并使用完整的优化目标进行更新。实验证明,所提出的 ASD 在 2D 蒸馏和文本到 3D 任务中表现优异,并将 ASD 扩展到图像编辑任务,获得有竞争力的结果。