潜变量识别和积物推测的加性译码器

Jul, 2023

潜变量识别和积物推测的加性译码器

Additive Decoders for Latent Variables Identification and Cartesian-Product Extrapolation

Sébastien Lachapelle, Divyat Mahajan, Ioannis Mitliagkas, Simon Lacoste-Julien

TL;DR通过添加器解码器对隐变量的辨别和超出支持图像的生成进行研究，提出了一种基于对象为中心的表示学习方法并展示了其在图像分解以及非线性独立成分分析方面的理论和实证研究。

Abstract

We tackle the problems of latent variables identification and "out-of-support" image generation in representation learning. We show that both are possible for a class of decoders that we call additive, which are reminiscent of decoders used for →

发现论文，激发创造

通过混合因素来分解变化因素

本文提出了一种不依赖于手动标注或数据领域知识的学习图像表示的方法，其实现了图像属性解离因素，其中每个因素代表一个一致的图像属性，这种解离后的特征可以应用于多种领域，例如将特定属性从一个图像转移到另一个图像、基于一个或多个属性进行分类或检索。这种方法中的自动编码器架构包括两个新的训练目标：不变性目标和分类目标，以确保每个特征块的编码对于其他属性是固定不变的，同时对于一致可辨的属性，避免出现完全被忽略的特征映射。实验验证了该方法在MNIST、Sprites和CelebA数据集上的有效性。

Nov, 2017

变分自编码器中的解缠纷问题

本文提出了VAEs的解耦合方法，即分解潜在表示，通过先验中有结构的聚合编码和适当的重叠来满足。这种分解不仅能实现特定的解耦，还可通过引入先验来实现其他更丰富类型的约束，并通过控制先验和潜在空间分布来改善解耦效果。此外，还介绍了另一套训练目标和先验选择来控制分解和解耦，并对β-VAE在控制潜在空间重叠方面的性质进行了分析。

Dec, 2018

生成模型中外观和视角的明确分离

通过一个双重潜在空间信息的生成模型，我们利用空间变换器和变分自动编码器构成了一种具有归纳偏差的Variationally Inferred Transformational Autoencoder(VITAE)方法用于实现解缠表示的学习，实验结果表明，我们的模型在MNIST图像上有效区分了数字类型和视觉风格，对于CelebA数据集，能够将人脸外形和姿态以及面部特征与面部形状分开。

Jun, 2019

变分自编码器和非线性ICA: 一个统一的框架

该论文研究通过因式分解先验分布的方法实现对观察变量和潜在变量的真实联合分布的识别，从而实现了对深度潜在变量模型的拆分，论文中提出了一种新的非线性独立成分分析框架，该框架同时适用于具有噪音、欠完备或离散观测的情况。

Jul, 2019

图像合成的无监督鲁棒性潜在特征分离

通过学习一个新的方法，深度生成模型可以不需要姿态注释便可学习到表征物体外观和姿态等属性的独立潜在特征，这些特征是可以解释的，且能够生成和修改图像。

Oct, 2019

通过可逆生成流解耦全局与局部表示

本研究提出了一种新的生成模型，它能够在完全无监督的环境中自动解耦图像的全局和局部表示，并借鉴样式转换文献中的结构来嵌入生成流以对解码器进行建模。实验结果表明我们的模型在密度估计、图像生成和无监督表示学习方面都非常有效。

Apr, 2020

利用协变量信息的表示学习预防iVAE后验崩溃

研究了可识别变分自编码器，在生成结构中使用辅助协变量来从协变量到观测值和独立组件（IC）中学习潜在的独立组件，并开发了一种称为 CI-iVAE 的新方法来解决后退化坍塌问题。

Feb, 2022

监督学习中高效表示识别

本文针对非线性独立成分分析的负面结果, 试图研究在没有条件独立性的辅助信息下如何实现解缠以及如何减少需要的辅助信息量。在一类模型中，我们证明理论上和实验上都可以实现解缠，即使辅助信息的维度远小于真实潜在表示的维度。

Apr, 2022

非线性ICA的可辨识性：稀疏性与更多拓展研究

通过在混合过程中添加约束条件（如结构稀疏性），我们在不需要辅助变量的情况下，实现了非线性ICA的非平凡可识别性。

Jun, 2022

多视角因果表示学习与部分可观测性

我们提出了一个统一的框架来研究从同时观察到的多个视图（如不同的数据模态）中学习到的表征的可识别性。我们允许部分观察的设置，其中每个视图都由一些潜在变量的子集的非线性混合构成，这些潜在变量可以有因果关系。我们通过对比学习和每个视图的单个编码器证明，任意数量的视图的所有子集共享的信息可以通过平滑双射进行学习。我们还提供了图形判据，指示哪些潜在变量可以通过一组简单的规则进行识别，我们称之为可识别代数。我们的总体框架和理论结果统一并扩展了关于多视图非线性ICA、解缠和因果表示学习的几项先前工作。我们在数字、图像和多模态数据集上实验证实了我们的论述。此外，我们证明了我们设置的不同特殊情况下先前方法的性能可以得到恢复。总的来说，我们发现在部分可观察性的一般性较弱的假设下，获取多个部分视图有助于识别更精细的表征。

Nov, 2023