潜变量识别和积物推测的加性译码器
本文提出了一种不依赖于手动标注或数据领域知识的学习图像表示的方法,其实现了图像属性解离因素,其中每个因素代表一个一致的图像属性,这种解离后的特征可以应用于多种领域,例如将特定属性从一个图像转移到另一个图像、基于一个或多个属性进行分类或检索。这种方法中的自动编码器架构包括两个新的训练目标:不变性目标和分类目标,以确保每个特征块的编码对于其他属性是固定不变的,同时对于一致可辨的属性,避免出现完全被忽略的特征映射。实验验证了该方法在MNIST、Sprites和CelebA数据集上的有效性。
Nov, 2017
本文提出了VAEs的解耦合方法,即分解潜在表示,通过先验中有结构的聚合编码和适当的重叠来满足。这种分解不仅能实现特定的解耦,还可通过引入先验来实现其他更丰富类型的约束,并通过控制先验和潜在空间分布来改善解耦效果。此外,还介绍了另一套训练目标和先验选择来控制分解和解耦,并对β-VAE在控制潜在空间重叠方面的性质进行了分析。
Dec, 2018
通过一个双重潜在空间信息的生成模型,我们利用空间变换器和变分自动编码器构成了一种具有归纳偏差的Variationally Inferred Transformational Autoencoder(VITAE)方法用于实现解缠表示的学习,实验结果表明,我们的模型在MNIST图像上有效区分了数字类型和视觉风格,对于CelebA数据集,能够将人脸外形和姿态以及面部特征与面部形状分开。
Jun, 2019
该论文研究通过因式分解先验分布的方法实现对观察变量和潜在变量的真实联合分布的识别,从而实现了对深度潜在变量模型的拆分,论文中提出了一种新的非线性独立成分分析框架,该框架同时适用于具有噪音、欠完备或离散观测的情况。
Jul, 2019
本研究提出了一种新的生成模型,它能够在完全无监督的环境中自动解耦图像的全局和局部表示,并借鉴样式转换文献中的结构来嵌入生成流以对解码器进行建模。实验结果表明我们的模型在密度估计、图像生成和无监督表示学习方面都非常有效。
Apr, 2020
研究了可识别变分自编码器,在生成结构中使用辅助协变量来从协变量到观测值和独立组件(IC)中学习潜在的独立组件,并开发了一种称为 CI-iVAE 的新方法来解决后退化坍塌问题。
Feb, 2022
本文针对非线性独立成分分析的负面结果, 试图研究在没有条件独立性的辅助信息下如何实现解缠以及如何减少需要的辅助信息量。在一类模型中,我们证明理论上和实验上都可以实现解缠,即使辅助信息的维度远小于真实潜在表示的维度。
Apr, 2022
我们提出了一个统一的框架来研究从同时观察到的多个视图(如不同的数据模态)中学习到的表征的可识别性。我们允许部分观察的设置,其中每个视图都由一些潜在变量的子集的非线性混合构成,这些潜在变量可以有因果关系。我们通过对比学习和每个视图的单个编码器证明,任意数量的视图的所有子集共享的信息可以通过平滑双射进行学习。我们还提供了图形判据,指示哪些潜在变量可以通过一组简单的规则进行识别,我们称之为可识别代数。我们的总体框架和理论结果统一并扩展了关于多视图非线性ICA、解缠和因果表示学习的几项先前工作。我们在数字、图像和多模态数据集上实验证实了我们的论述。此外,我们证明了我们设置的不同特殊情况下先前方法的性能可以得到恢复。总的来说,我们发现在部分可观察性的一般性较弱的假设下,获取多个部分视图有助于识别更精细的表征。
Nov, 2023