关键词diffusion autoencoders
搜索结果 - 6
- 全球反事实方向
本文研究了一种全局化的视觉反事实解释方法,通过发现扩散自动编码器的潜在空间可以编码给定分类器的推理过程,提出一种新的基于代理的方法,以完全黑盒方式推断出两种全局反事实方向(GCDs),并展示了与潜在综合梯度相结合的新的黑盒归因方法,同时加强 - 神经相加图片模型:插值解释
通过综合建模方法,结合神经添加模型和扩散自编码器,我们能够有效识别图像效果的潜在隐藏语义并完全理解表格效果的影响。我们的方法具有高度灵活性,使我们能够全面探索各种图像特征的影响。通过消融实验,我们展示了该方法能够准确识别复杂的图像效果。为了 - 探索面部变形的扩散自编码器设计空间
使用扩散自动编码器创建的面部变形是一项新兴技术,本研究探索了设计空间的三个方面,即:采样算法、逆向 DDIM 求解器和通过少量噪声进行部分采样。
- DiffuseGAE:通过解耦表示的可控高保真图像操作
本篇研究介绍 Diff-AE 与 GAE 两种基于 Diffusion probabilistic models 的编码器模型,实现由多个属性进行图像编辑和生成,大大降低了计算需求,并达到了相当不错的效果,对潜在特征得到了更好的分离。
- 预训练扩散概率模型中的无监督表征学习
本文提出了一种基于现有预训练 DPM 模型的图像重建通用方法 PDAE,实现了比 Diff-AE 更好的训练效率和性能,并通过对分类器引导采样的机制填补信息缺失的空隙,使编码器对图像进行更好的重建,表现出了较高的有效性、效率和灵活性。
- CVPR扩散视频自编码器:通过分离视频编码实现时态一致的人脸视频编辑
本文提出了一种基于扩散自编码器的全新的人脸视频编辑框架,该框架能够成功地从给定的视频中提取分解特征 - 首次作为人脸视频编辑模型 - 并且允许我们通过简单地操纵时间不变的特征来实现视频编辑,以解决在编辑帧之间的时间一致性等问题。该模型还具有