Dec, 2023

多源轨迹建模与分离的动态变分自编码器混合

TL;DR本文中,我们提出了一种称为混合动态变分自编码器(MixDVAE)的潜在变量生成模型,用于建模由多个移动源组成的系统的动态。通过在单源数据集上预训练 DVAE 模型来捕捉源的动态,然后将多个预训练 DVAE 模型的实例集成到一个多源混合模型中,带有离散观测 - 源分配潜变量。使用变分期望最大化算法估计离散的观测 - 源分配变量和表示源内容 / 位置的连续 DVAE 变量的后验分布,从而得到多源轨迹估计。我们在计算机视觉任务(多目标跟踪)和音频处理任务(单声道音频源分离)上展示了所提出的 MixDVAE 模型的多功能性。实验结果表明,该方法在这两个任务上表现良好,并超过了几种基准方法。