不是随机缺失数据下的深度生成建模
研究在深度潜变量模型(DLVM)中如何处理缺失数据的问题,提出了一种称为 MIWAE 的基于重要性加权自编码器(IWAE)的方法,可以最大化观察数据的对数似然的潜在下界,通过该方法实现单一和多重插值。在这些不完整的 MNIST 数字上训练的深度卷积 DLVM,通过多重插值,其测试性能与完整数据集训练的网络相似,并且在各种连续和二元数据集上,MIWAE 提供精确的单一插值,并且在最先进方法中非常有竞争力。
Dec, 2018
本文探讨了深度潜变量模型中精确似然的一般性质及其在实践中的应用,特别是关于参数估计和缺失数据插补。作者介绍了一种基于条件似然的算法,用于深度潜变量模型中的缺失数据插补,并在多个数据集中对比了该算法和通常用于 DLVMs 的插补方案,结果表明该算法显著优于传统方案。作者还探讨了无约束模型似然函数无界的问题及其在模式崩溃中的作用,并提出了确保最大似然估计存在的方法。
Feb, 2018
我们提出了一个灵活高效的潜变量模型,利用高斯过程捕捉样本与相关缺失模式之间的时间相关性,并构建可变分自动编码器模型来处理高维度、结构化缺失模式和未知随机过程等数据挑战。
Feb, 2024
开发了一种新颖的潜在变量模型,通过生成缺失数据的损坏过程对处理缺失数据集进行了模糊处理,并推导出相应的易于实现、可处理可随机缺失和不随机缺失数据、适用于高维输入、VAE 编码器和解码器原则性访问指标变量以确定数据元素是否缺失的可跟踪证据下限 (ELBO)。在 MNIST 和 SVHN 数据集上,相比现有方法,证明了观测数据的边际对数似然和更好的缺失数据插值提高。
Jun, 2020
本文提出一种新的深度顺序潜变量模型,通过高斯过程在时间上平滑演化的抽象低维表示来实现缺失数据的非线性降维和数据插值,旨在解决在医疗和金融等领域中常见的缺失数据问题。我们的方法优于传统的和基于深度学习的数据插值方法,并提供可解释的不确定性估计。
Jul, 2019
数据分析中,常常遇到缺失非随机(MNAR)的问题,本文从新的视角重新考虑 MNAR 问题,提出了一种基于生成模型的联合概率分解方法,并成功应用于数据的插补和遗漏掩码的重建。实验证明,我们的方法在 MNAR 问题上超过了现有的基线模型,并且在均方根误差上取得了显著的提升(平均提高了 9.9% 到 18.8%),同时也得到了更好的掩码重建准确性,使得插补的过程更加可靠。
Aug, 2023
该论文研究了无监督学习中生成模型的训练方法,提出了一种在对抗网络与似然训练之间进行混合训练的方法,其中使用深度可逆变换来解决概率和逆变换之间的冲突,实现了更好的生成样本和更高的似然性评估。
Jan, 2019
本文提出了一种基于 Deep Gaussian processes(DGPs)的新型重要性加权目标函数,通过引入含噪变量作为潜在协变量,相比于经典的变分推断,可以在提高准确性的同时节省计算量,并且在更深层次的模型中表现良好。
May, 2019
本文提出了一种贝叶斯方法,通过非标准变分推理框架在 GP-LVM 中近似积分出潜在变量,从而通过最大化解析较低下界的确切边缘似然来训练 GP-LVM,在学习非线性动态系统方面具有鲁棒性和自动选择非线性潜在空间维数的能力。
Sep, 2014