Nov, 2024
小波潜在扩散(Wala):具有紧凑小波编码的十亿参数三维生成模型
Wavelet Latent Diffusion (Wala): Billion-Parameter 3D Generative Model
with Compact Wavelet Encodings
TL;DR本研究解决了当前大规模三维生成模型在细节和复杂几何形状表现不足的问题。通过提出一种名为小波潜在扩散(WaLa)的方法,将三维形状编码为基于小波的紧凑潜在编码,实现了高达2427倍的压缩比,极大地提高了训练效率,并且生成高质量的三维形状。该方法在多个数据集上展示了最先进的性能,并开源了相关代码,提供了业内最大的预训练三维生成模型。