- 学习可解释的控制式复调音乐生成的表示
本文提出了一种基于 VAE 的音乐分离模型,用于将和弦和纹理这两个可解释的因子分离出来,从而实现音乐生成过程的可控,在生成音乐时具有广泛的应用,包括作曲风格转换、纹理变化和伴奏编排,并通过客观和主观评价证明了该方法的成功分离和高质量的音乐生 - 可控游戏层次混合的变分自编码器方法
本研究使用变分自编码器(VAEs)对游戏关卡进行创意设计,通过训练 VAE 于超级马里奥兄弟和战神等游戏的数据,捕捉潜在空间,然后将这些空间用于生成结合了两种游戏特征的新的关卡片段,并通过潜在空间中的进化搜索进行进一步的优化。与类似的生成模 - PixelVAE++:具离散先验的改进 PixelVAE 模型
PixelVAE++ 是一种结合了 VAE 和 PixelCNN++ 的新型生成模型,可在保留潜变量信息的同时学习图像的全局和局部结构,并在 MNIST、Omniglot、CIFAR-10 数据集中实现了最先进的性能。
- ICML可解释文本生成的离散指数族混合变分自编码器
本文提出 DEM-VAE 模型,使用指数族混合分布代替高斯分布,针对标准变分训练算法的模式坍塌问题,提出了一种有效的训练算法,使得训练具有良好的结构潜空间,实验结果表明,DEM-VAE 模型在文本生成基准测试中优于强基准。
- 相关因素 VAE:学习和识别解缠因素
我们提出了一种新颖的基于 VAE 的深度自编码器模型,可以完全无监督地学习分解的潜在表征,具有识别所有有意义的变异源及其基数的能力,该模型通过引入所谓的关联指标变量并联合 VAE 参数进行自动学习,有效地将总相关损失集中到相关因素上,我们的 - CVPR通过标签相关 / 不相关维度对 VAE 的潜空间进行解耦
该论文提出了一种将潜空间解析为与标签相关和无关维度的方法来避免 VAE 中的后验坍塌问题,并通过高斯混合分布优化标签相关潜空间的编码器,以直接增加与标签之间的信息量。该模型还可以扩展到 GAN 来生成高质量和多样化的图像。
- 简单,分布式和加速的概率编程
描述了一种将概率编程嵌入到深度学习中的简单、低级别的方法,它将概率编程精简为一个抽象 - 随机变量。使用 TensorFlow 的轻量级实现实现了许多应用程序:基于模型的并行变分自动编码器(VAE);基于数据的并行自回归模型(Image T - 内省变分自编码器:用于照片图像合成的模型
介绍了一种新颖的内省变分自动编码器 (IntroVAE) 模型,其可以用于合成高分辨率的照片图像,并通过将 GAN 和 VAE 两种生成框架集成到一个简单而高效的单流架构中,实现了高性能的图像生成。
- 离散序列自编码器
这篇论文介绍了一种针对高维时序数据(如视频或音频)的 VAE 模型架构,学习了数据的潜在表示,可以近似地分解潜在的时间相关特征(动态)和随时间保持不变的特征(内容),从而进行内容和动态的部分控制,并给出了在人工生成的卡通视频片段和声音记录上 - WWW基于变分自编码器的 Web 应用程序中季节性 KPI 的无监督异常检测
本文提出了一种基于 VAE 的无监督异常检测算法 Donut,它能够有效地检测季节性的 KPI,并在理论上得到了可靠的解释。通过应用于一家全球互联网公司的数据,Donut 表现出比监督学习和基线 VAE 更好的性能,其最佳 F1 得分在 0 - 半监督学习的解缩变分自编码器
本文提出了一种名为 SDVAE 的半监督变分自编码器,其将输入数据转化为可解释和不可解释的特征表示,使用分类信息来规范可解释的特征表示,并使用强化学习来增强特征学习能力,此框架适用于图像和文本数据。
- Sketch-pix2seq: 生成多种类别的草图模型
提出了一种改进型的模型,即 sketch-pix2seq 模型,用于学习和生成多类别素描,其中替换了 RNN 编码器为 CNN,从目标函数中删除了 KL 散度,实验表明其性能优于其他模型
- 为语音生成与转换学习潜在表征
使用变分自编码器实现了对自然语音生成过程的建模与学习,获得了较大突破。利用学习的潜在空间算术操作,实现了对语音的音素内容或说话人身份的无监督修改,无需平行监控数据。
- 生成模型的对抗性示例
本篇研究探索在变分自编码器(VAE)和 VAE-GAN 等深度生成模型中生成对抗性样本的方法,并提出了三种攻击方式来测试针对 MNIST、SVHN 和 CelebA 数据集训练的网络,分别利用基于分类的对手,直接利用 VAE 的损失函数生成