关键词disentangled latent representations
搜索结果 - 3
- LADIS: 用于三维形状编辑的语言分离技术
借助学习解耦的潜在表示,包括新颖的网络架构、解耦损失和新的编辑过程,我们旨在解决通过文本进行三维形状编辑时面临的挑战,并提出了称为逐部分编辑精度的新度量方法来评估编辑的区域范围,并表明我们的方法在编辑局部精度方面优于现有方法约 20%,在语 - ACL学习鲁棒的潜在特征表示用于可控语音合成
提出了一种 RTI-VAE 方法,使用修改过的 Transformer 架构和信息减少技术来学习可控制的语音数据的潜在变量,从而降低说话者属性聚类的重叠率,相比于 LSTM-VAE 和 vanilla Transformer-VAE,降低了 - ECCV用潜在变化可预测性学习分离表示
本文提出了一种基于变量可预测性的方法来优化 VAE 和 GAN 框架中的潜变量表征的解缠方法,该方法通过最大化潜变量变化与相应图像变化之间的互信息来增强变量的可预测性,同时提出了一种新的评估指标来度量潜在维度的解缠性能。研究表明,所提出的变