生成式潜在形状模型的几何分离
本文提出了一种基于 3D 生成模型的非刚性可变形场景表达方法,通过联合学习规范模型及其变形,并使用姿态正则化损失来改善模型的场景与摄影视角的分离性,同时还可以嵌入真实图像中并进行编辑。
Mar, 2022
通过一个双重潜在空间信息的生成模型,我们利用空间变换器和变分自动编码器构成了一种具有归纳偏差的 Variationally Inferred Transformational Autoencoder (VITAE) 方法用于实现解缠表示的学习,实验结果表明,我们的模型在 MNIST 图像上有效区分了数字类型和视觉风格,对于 CelebA 数据集,能够将人脸外形和姿态以及面部特征与面部形状分开。
Jun, 2019
本研究基于 VAE 框架,定量定性地评估了生成的潜在空间在向量操作和语义解缠方面的几何特性,实证结果表明潜在空间中的角色内容被解缠,这为通过操纵向量在潜在空间上的遍历来控制解释生成提供了机会。
Oct, 2022
本文提出了一种直观而有效的自监督方法,通过跨不同形状交换任意特征来培训三维形状变分自编码器,从而鼓励特征的解缠缚潜在表示。实验结果表明,我们开发的方法正确解耦了身体和面部特征的生成,同时保持了良好的表示和重构能力。
Nov, 2021
本文提供了一种使用预训练网络来学习数据的解缠表示的方法,以实现最小的监督,同时展示了该方法在头部图像领域上成功将身份从其他面部属性中解缠并显示出较好的评估结果。
May, 2020
本文提出了一种创新的框架,利用两个分支的自编码器来学习内容和风格分离的表征,并通过多个损失约束辅助无监督学习,最终生成清晰、高质量的 256*256 分辨率的图片。
May, 2019
本文基于几何学的角度探究 GAN 潜在空间的性质和图像变异机制,并提出一种基于网络结构的方法计算 GAN 图像多丽安流形的黎曼度量,这一方法可以有效地优化潜在空间的优化等应用,并便于解释变换维度。
Jan, 2021
该论文提出了一种考虑生成模型的几何特性的算法,它可以使得在潜变量表示中使用简单的聚类算法更加有效,同时提出了一种新的用于建模变分自编码器中不确定性的架构。实验表明,此算法能够反映数据的内部结构。
Sep, 2018
本文介绍了一种从自然图像中学习生成 3D 形状的生成模型的全面无监督方法,其中利用 GAN 等深度学习技术实现,从而生成出真实的三维图像,实现了从二维图像向三维图像的转换。
Oct, 2019