多源神经变分推断

AAAINov, 2018

Multi-Source Neural Variational Inference

Richard Kurle, Stephan Günnemann, Patrick van der Smagt

TL;DR本文提出了一个基于可变自编码器的多源学习框架，其中每个自编码器都是在不同的信息源的条件下进行的。我们在小数据集上展示了其学习效果，并在结构化输出预测方面进行了评估，同时证明了在多源情况下冲突检测和冗余可以增强推断的鲁棒性。

Abstract

Learning from multiple sources of information is an important problem in machine-learning research. The key challenges are learning representations and formulating inference methods that take into account the complementarity and redundancy of various information sources. In this paper we formulate a →

multi-source learning variational autoencoder shared representations structured output prediction conflict detection

发现论文，激发创造

多模式深度生成模型的变分混合专家自编码器

本文阐述了成功学习多模态生成模型的四个判定标准，提出了一种混合专家多模态变分自编码器（MMVAE）来学习不同模态的生成模型，并展示了其在具有挑战性的图像 - 语言数据集上实现四个标准的能力，从质量和数量两方面进行了定性和定量。

Nov, 2019

多模态 VAEs 中的统一多样性：改进的表示学习

用于多模态数据的变分自编码器在数据分析中具有许多任务的潜力，如表示学习、条件生成和插补。我们通过用软约束替换这些硬约束，提出了一种新的专家混合先验方法，软指导每个模态的潜编码向共享的聚合后验靠近，从而得到一个更好的潜编码表示，并提高了对缺失数据模态的填充能力。在多个基准数据集和具有挑战性的现实神经科学数据集上进行了广泛实验证明，与现有方法相比，学到的潜编码表示和缺失数据模态的插补有所改进。

Mar, 2024

多源轨迹建模与分离的动态变分自编码器混合

本文中，我们提出了一种称为混合动态变分自编码器（MixDVAE）的潜在变量生成模型，用于建模由多个移动源组成的系统的动态。通过在单源数据集上预训练 DVAE 模型来捕捉源的动态，然后将多个预训练 DVAE 模型的实例集成到一个多源混合模型中，带有离散观测 - 源分配潜变量。使用变分期望最大化算法估计离散的观测 - 源分配变量和表示源内容 / 位置的连续 DVAE 变量的后验分布，从而得到多源轨迹估计。我们在计算机视觉任务（多目标跟踪）和音频处理任务（单声道音频源分离）上展示了所提出的 MixDVAE 模型的多功能性。实验结果表明，该方法在这两个任务上表现良好，并超过了几种基准方法。

Dec, 2023

通过变分自编码器进行多实例特征深度学习

提出了一种结合了判别和生成模型，基于弱监督深度学习的新型深度学习框架，用于解决多示例学习中来自于正实例标签不确定性的挑战，并成功应用于音频事件检测和分类任务中，相对以往的研究成果表现更优，具有良好的可扩展性。

Jul, 2018

变分公平自编码器

研究如何学习能保留数据中大部分信息且对于某些噪声或敏感变化因素具有不变性的表示形式，提出了一种基于变分自编码器的模型，包括鼓励灵敏因素和潜在因素独立的优先知识和基于 “最大均值差异”（MMD）的附加惩罚项，实验证明该方法比以前的工作更有效。

Nov, 2015

多模态潜在扩散

介绍了一种基于确定性自编码器和遮蔽扩散模型的多模态生成模型，结果优于现有竞争对手的生成质量和一致性。

Jun, 2023

优化用于视觉任务的变分自编码器潜在表示中的不确定性

深度学习方法在计算神经科学中作为建模工具变得越来越重要，本文系统地研究了变分自编码器的不确定性表示，提出了一种新的方法解释偏离变分自编码器 (EA-VAEs)，并发现它在各种情况下能够产生有意义的不确定性报告，可在计算神经科学的感知模型和计算机视觉的推理工具中发挥作用。

Apr, 2024

InVA：整合型变分自编码器用于多模态神经影像数据的协调

该研究论文介绍了一种名为 Integrative Variational Autoencoder（InVA）的方法，通过借用来自不同来源的多个图像的信息，捕捉了结果图像与输入图像之间的复杂非线性关联，并实现了快速计算，从而提供了在人脑磁共振成像（MRI）中从多个皮层结构测量中获得代价高昂的正电子发射断层摄影（PET）的高精度预测推断。

Feb, 2024

无限变分自编码器用于半监督学习

本文提出了一种基于混合模型和狄利克雷过程的无限变分自编码器，其容量能够适应输入数据，从而使得自动编码器数量能够根据数据自动变化，实验结果表明该方法在半监督学习中具有很高的灵活性。

Nov, 2016

基于变分自编码器的图扩散源定位用于图反问题

本文提出了一种基于概率模型的通用框架：SL-VAE 来定位任意扩散模式下的扩散源。SL-VAE 利用前向扩散估计模型和深度生成模型，近似扩散源分布并量化不确定性。最后，通过导出一个统一的目标函数，强制模型在任意扩散模式下进行泛化。在 7 个真实世界的数据集上进行的广泛实验表明了 SL-VAE 在重建扩散源方面的优越性。

Jun, 2022