TVAE: 利用度量学习的基于三元组的变分自编码器
本文提出了一种方法,将变分自编码器和深度度量学习相结合,以在高维和结构化的输入空间上执行贝叶斯优化。通过深度度量学习中的想法,利用黑盒函数的标签指导来构造 VAE 潜在空间,促进高斯过程拟合,从而改善 BO 性能。重要的是,该方法在半监督环境下运行,在只有少量标记数据点可用时表现良好。在三个真实世界任务上进行实验,在罚款 logP 分子生成基准测试中取得了最先进的成果,仅需之前方法所需标记数据的 3%。作为理论贡献,我们提出了 VAE BO 的消失遗憾证明。
Jun, 2021
提出了一种自动编码器技术,结合了变分自动编码器与生成式对抗网络,可透过特征表示量测数据空间的相似性,进而以特征误差为基础重新构建数据分布,其具有位移不变性,运用在脸部图像上可提供更优的视觉保真度,并能够学习出抽象且高层次的视觉特征。
Dec, 2015
提出了一种变分空间转换自编码器(VTAE),通过在 Riemann 流形上最小化测地线来改善表征学习,并提高计算机视觉任务的预测准确性和适用性,包括图像插值和重构。
Apr, 2023
提出了一种结合了判别和生成模型,基于弱监督深度学习的新型深度学习框架,用于解决多示例学习中来自于正实例标签不确定性的挑战,并成功应用于音频事件检测和分类任务中,相对以往的研究成果表现更优,具有良好的可扩展性。
Jul, 2018
我们提出了一个多模态变分自编码器 (M-VAE),能够在学习图像特征和语义空间之间的共享潜在空间上,通过使用多模态损失来拟合多模态数据。该方法可用于预测新样本,且实验结果表明在广义零样本学习方面,我们提出的模型优于当前最先进的方法。
Jun, 2021
本研究提出了一种新颖的方法来构建变分自编码器 (Variational Autoencoder,VAE), 该方法通过 enforced deep feature consistency 的方式替代了传统的像素级别的损失,以充分保留输入数据的空间相关性,产生更自然的视觉效果和更好的感知质量。 对 CelebA 数据集的测试结果表明,我们模型能够优于其他文献中的方法,并且还能够产生能捕捉面部表情语义信息的潜在向量,这些向量可用于实现面部属性预测的最新性能。
Oct, 2016
该研究提出了一种将遗传算法和变分自编码器相结合的进化变分自编码器方法,通过动态生成和更新不确定性权衡学习,解决了现有方法中面临的问题,包括 KL 消失问题和基于深度学习中的早期收敛和随机搜索问题。实验结果表明,与竞争方法相比,eVAE 在文本生成、图像生成质量等方面均有显著改善。
Jan, 2023
本文利用 Poincaré 球模型的超几何结构作为潜变量空间,研究了 VAE 在这个空间的运用,该方法在嵌套数据结构下表现出色,并展现了超几何结构对于 VAE 的优越性。
Jan, 2019
通过引入第二个参数化的编解码对和一个额外的固定编码器,我们发展了三种 VAE 的变种,并使用神经网络学习编码器 / 解码器的参数来比较这些变种与原始 VAE 的 ELBO 逼近。其中一种变化导致了一个 EUBO,可以与原始 ELBO 一起用于研究 VAE 的收敛性。
Dec, 2022