关键词discrete latent variable models
搜索结果 - 4
- 通过主题感知离散潜变量学习语义文本相似度
本文提出了一种基于主题的离散潜变量模型,通过向量量化学习句子对表示的共享潜空间,进一步将量化表示注入基于语义驱动的注意力机制变压器语言模型,以提高语义相似性的性能。
- 用神经隐马尔可夫模型学习离散语音表示的依赖关系
本文研究了语音感知的分段本质,并提出了一种基于神经隐马尔科夫模型的学习方法,该方法应用于离散的隐变量模型以及自监督学习中,模型中加入了模型变量之间的关联性,从而有效提高了模型的性能。
- 向量量化自编码器的理论与实验
该研究利用基于期望最大化算法的训练技术提高 VQ-VAE 模型在 CIFAR-10 数据集上的图像生成结果,并通过知识蒸馏技术,开发出一种非自回归机器翻译模型,其准确性几乎与强贪婪自回归基线变压器相当,但在推理速度上快 3.3 倍。
- ICMLDVAE++:具有重叠变换的离散变分自编码器
通过提出一种基于两个重叠分布的混合平滑变换的新类变换,我们提高了对离散潜变量模型的训练能力,并且分别用 dircted 和 undirected 先验训练了二进制潜在模型,发现其优于其他几种连续弛豫过程。最终我们发展了一个具备全局离散先验和