BriefGPT.xyz
大模型
Ask
alpha
关键词
latent space disentanglement
搜索结果 - 5
ICCV
用显式的程序化知识引导视频预测
我们提出了一种将领域的程序化知识集成到深度学习模型中的通用方法,并通过基于物体为中心的深度模型对视频预测进行应用,表明这比仅使用数据驱动模型能够获得更好的性能。我们开发了一种使潜在空间解缠结的架构,以利用集成的程序化知识,并建立了一个允许模
→
PDF
8 days ago
ExFaceGAN: 探索 GAN 的学习潜空间中的身份方向,用于合成身份生成
ExFaceGAN 提出了一种在预先训练的 GAN 潜空间中解缠身份信息的框架,使得可以生成任何合成身份的多个样本,而生成图像的变异性不仅限于特定属性。更进一步,本文证明了使用 ExFaceGAN 生成的数据可以成功地用于训练面部识别模型。
PDF
a year ago
FEAT: 带有注意力机制的人脸编辑
本文介绍了一种基于 StyleGAN 生成器和学习到的注意力图的方法,通过在编辑图像时使用注意力图作为掩蔽层,同时使用 CLIP 算法来引导潜空间的编辑,实现对面部局部区域的控制性编辑。实验结果表明,与其他替代方法相比,我们的方法可以实现非
→
PDF
2 years ago
GAN-Control: 明确可控的 GANs
我们提出了一个具有明确控制 GAN 生成的图像的框架,借助于对抗性训练(GANs)、明确控制的潜在空间以及对人类的符号解释模型进行了对生成图像的控制,可扩展到人类脸谱以外的领域,实现了身份、年龄、姿态、表情、头发色彩和光照方面的控制,并且在
→
PDF
3 years ago
CVPR
探索可变自编码器的可视化解释
本文提出了一种基于梯度的注意力机制技术,用于解释变分自编码器(VAE)及其预测,该技术通过生成学习到的潜在空间的视觉注意力,可用于图像中异常的定位,并能融入模型训练来帮助改善潜在空间分解,这在 MVTec-AD 和 Dsprites 数据集
→
PDF
5 years ago
Prev
Next