不是随机缺失数据下的深度生成建模

ICLRJun, 2020

不是随机缺失数据下的深度生成建模

not-MIWAE: Deep Generative Modelling with Missing not at Random Data

Niels Bruun Ipsen, Pierre-Alexandre Mattei, Jes Frellsen

TL;DR提出了一种基于深度神经网络和重要性采样变分推理的方法，用于建立和拟合深度潜变量模型。该方法可以在处理缺失数据时，显式地建模缺失过程以及缺失数据本身之间的依赖关系，以期能更好地应用到实际问题。

Abstract

When a missing process depends on the missing values themselves, it needs to be explicitly modelled and taken into account while doing likelihood-based inference. We present an approach for building and fitting deep latent variable models (DLVMs) in cases where the →

missing process deep latent variable models likelihood-based inference neural network importance-weighted variational inference

发现论文，激发创造

MIWAE: 不完整数据的深度生成建模和插值

研究在深度潜变量模型（DLVM）中如何处理缺失数据的问题，提出了一种称为 MIWAE 的基于重要性加权自编码器（IWAE）的方法，可以最大化观察数据的对数似然的潜在下界，通过该方法实现单一和多重插值。在这些不完整的 MNIST 数字上训练的深度卷积 DLVM，通过多重插值，其测试性能与完整数据集训练的网络相似，并且在各种连续和二元数据集上，MIWAE 提供精确的单一插值，并且在最先进方法中非常有竞争力。

Dec, 2018

利用深度潜变量模型的精确似然

本文探讨了深度潜变量模型中精确似然的一般性质及其在实践中的应用，特别是关于参数估计和缺失数据插补。作者介绍了一种基于条件似然的算法，用于深度潜变量模型中的缺失数据插补，并在多个数据集中对比了该算法和通常用于 DLVMs 的插补方案，结果表明该算法显著优于传统方案。作者还探讨了无约束模型似然函数无界的问题及其在模式崩溃中的作用，并提出了确保最大似然估计存在的方法。

Feb, 2018

高维点过程结构缺失的潜变量模型

我们提出了一个灵活高效的潜变量模型，利用高斯过程捕捉样本与相关缺失模式之间的时间相关性，并构建可变分自动编码器模型来处理高维度、结构化缺失模式和未知随机过程等数据挑战。

Feb, 2024

缺失数据下的 VAEs

开发了一种新颖的潜在变量模型，通过生成缺失数据的损坏过程对处理缺失数据集进行了模糊处理，并推导出相应的易于实现、可处理可随机缺失和不随机缺失数据、适用于高维输入、VAE 编码器和解码器原则性访问指标变量以确定数据元素是否缺失的可跟踪证据下限 (ELBO)。在 MNIST 和 SVHN 数据集上，相比现有方法，证明了观测数据的边际对数似然和更好的缺失数据插值提高。

Jun, 2020

GP-VAE：深度概率时间序列插值

本文提出一种新的深度顺序潜变量模型，通过高斯过程在时间上平滑演化的抽象低维表示来实现缺失数据的非线性降维和数据插值，旨在解决在医疗和金融等领域中常见的缺失数据问题。我们的方法优于传统的和基于深度学习的数据插值方法，并提供可解释的不确定性估计。

Jul, 2019

使用深度高斯混合模型估计缺失值的条件密度

本研究提出了一种结合深度神经网络灵活性和高斯混合模型简洁性的方法来估计缺失值的条件概率分布，并实验验证了我们的模型在插补缺失值方面的有效性。

Oct, 2020

缺失非随机数据的深度生成填补模型

数据分析中，常常遇到缺失非随机（MNAR）的问题，本文从新的视角重新考虑 MNAR 问题，提出了一种基于生成模型的联合概率分解方法，并成功应用于数据的插补和遗漏掩码的重建。实验证明，我们的方法在 MNAR 问题上超过了现有的基线模型，并且在均方根误差上取得了显著的提升（平均提高了 9.9% 到 18.8%），同时也得到了更好的掩码重建准确性，使得插补的过程更加可靠。

Aug, 2023

生成模型的自适应密度估计

该论文研究了无监督学习中生成模型的训练方法，提出了一种在对抗网络与似然训练之间进行混合训练的方法，其中使用深度可逆变换来解决概率和逆变换之间的冲突，实现了更好的生成样本和更高的似然性评估。

Jan, 2019

使用重要性加权变分推断的深高斯过程

本文提出了一种基于 Deep Gaussian processes（DGPs）的新型重要性加权目标函数，通过引入含噪变量作为潜在协变量，相比于经典的变分推断，可以在提高准确性的同时节省计算量，并且在更深层次的模型中表现良好。

May, 2019

高斯过程模型输入不确定性的变分推断

本文提出了一种贝叶斯方法，通过非标准变分推理框架在 GP-LVM 中近似积分出潜在变量，从而通过最大化解析较低下界的确切边缘似然来训练 GP-LVM，在学习非线性动态系统方面具有鲁棒性和自动选择非线性潜在空间维数的能力。

Sep, 2014