多源神经变分推断
本文阐述了成功学习多模态生成模型的四个判定标准,提出了一种混合专家多模态变分自编码器(MMVAE)来学习不同模态的生成模型,并展示了其在具有挑战性的图像 - 语言数据集上实现四个标准的能力,从质量和数量两方面进行了定性和定量。
Nov, 2019
用于多模态数据的变分自编码器在数据分析中具有许多任务的潜力,如表示学习、条件生成和插补。我们通过用软约束替换这些硬约束,提出了一种新的专家混合先验方法,软指导每个模态的潜编码向共享的聚合后验靠近,从而得到一个更好的潜编码表示,并提高了对缺失数据模态的填充能力。在多个基准数据集和具有挑战性的现实神经科学数据集上进行了广泛实验证明,与现有方法相比,学到的潜编码表示和缺失数据模态的插补有所改进。
Mar, 2024
本文中,我们提出了一种称为混合动态变分自编码器(MixDVAE)的潜在变量生成模型,用于建模由多个移动源组成的系统的动态。通过在单源数据集上预训练 DVAE 模型来捕捉源的动态,然后将多个预训练 DVAE 模型的实例集成到一个多源混合模型中,带有离散观测 - 源分配潜变量。使用变分期望最大化算法估计离散的观测 - 源分配变量和表示源内容 / 位置的连续 DVAE 变量的后验分布,从而得到多源轨迹估计。我们在计算机视觉任务(多目标跟踪)和音频处理任务(单声道音频源分离)上展示了所提出的 MixDVAE 模型的多功能性。实验结果表明,该方法在这两个任务上表现良好,并超过了几种基准方法。
Dec, 2023
提出了一种结合了判别和生成模型,基于弱监督深度学习的新型深度学习框架,用于解决多示例学习中来自于正实例标签不确定性的挑战,并成功应用于音频事件检测和分类任务中,相对以往的研究成果表现更优,具有良好的可扩展性。
Jul, 2018
研究如何学习能保留数据中大部分信息且对于某些噪声或敏感变化因素具有不变性的表示形式,提出了一种基于变分自编码器的模型,包括鼓励灵敏因素和潜在因素独立的优先知识和基于 “最大均值差异”(MMD)的附加惩罚项,实验证明该方法比以前的工作更有效。
Nov, 2015
深度学习方法在计算神经科学中作为建模工具变得越来越重要,本文系统地研究了变分自编码器的不确定性表示,提出了一种新的方法解释偏离变分自编码器 (EA-VAEs),并发现它在各种情况下能够产生有意义的不确定性报告,可在计算神经科学的感知模型和计算机视觉的推理工具中发挥作用。
Apr, 2024
该研究论文介绍了一种名为 Integrative Variational Autoencoder(InVA)的方法,通过借用来自不同来源的多个图像的信息,捕捉了结果图像与输入图像之间的复杂非线性关联,并实现了快速计算,从而提供了在人脑磁共振成像(MRI)中从多个皮层结构测量中获得代价高昂的正电子发射断层摄影(PET)的高精度预测推断。
Feb, 2024
本文提出了一种基于混合模型和狄利克雷过程的无限变分自编码器,其容量能够适应输入数据,从而使得自动编码器数量能够根据数据自动变化,实验结果表明该方法在半监督学习中具有很高的灵活性。
Nov, 2016
本文提出了一种基于概率模型的通用框架:SL-VAE 来定位任意扩散模式下的扩散源。SL-VAE 利用前向扩散估计模型和深度生成模型,近似扩散源分布并量化不确定性。最后,通过导出一个统一的目标函数,强制模型在任意扩散模式下进行泛化。在 7 个真实世界的数据集上进行的广泛实验表明了 SL-VAE 在重建扩散源方面的优越性。
Jun, 2022