交互信息变分最大化实现跨域解缠
本文提出了一种基于生成对抗网络和自动编码器的双向图像转换方法,通过交叉域解缠表示技术,将内部表示分离成共享部分和专有部分,并可在不需要标注数据的情况下实现多模数据分布下的区分和检索。在多模图像翻译任务中,该模型优于现有的最新模型,并在具有挑战性的数据集上表现出更好的结果。
May, 2018
无监督多领域转换是将数据从一个领域转换到其他领域的任务,我们提出的方法基于改进的变分自编码器,利用两个分离的潜在变量以一种可控的方式实现。我们通过实验证明了我们的方法在不同的视觉数据集上可以提高其他知名方法的性能,并证明了一个潜在变量存储与领域相关的所有信息,而另一个几乎不包含任何领域信息。
Jan, 2024
本文针对无监督视频领域自适应这一实用但具有挑战性的任务,首次从分离视点入手,对相关领域信息和时空语义信息进行数据转换,提出了一种 TranSVAE 框架并设计了多个目标函数,经强大的实验验证,相比几种现有技术,TranSVAE 具有更大的有效性和优越性。
Aug, 2022
本文研究了如何在无监督学习的情况下,学会将 A 和 B 两个不同的数据领域进行映射,以使得 B 中的信息包含 A 中的所有信息并且增加一些附加信息。为此,采用了一个双通路编码器和一个解码器,并且采用了一些损失函数对两个域进行重建和区分度优化。实验结果表明,该方法比文献导向的翻译方法更为简单,并且在一些视觉领域中取得了令人信服的结果,例如 no-glasses 到 glasses 以及基于参考图像添加面部毛发等。
Jan, 2020
我们提出了一种基于 Total Correlation Variational Autoencoder 的无监督学习方法,用以生成 disentangled representations,并介绍了一种分类器无关的 disentanglement 度量,称为 mutual information gap (MIG)。通过对 restricted 和 non-restricted 实验结果的定量和定性分析,我们展示了 latent variables model 的 total correlation 和 disentanglement 之间的强关联关系。
Feb, 2018
本文提出了一个使用无成对训练数据和单个网络同时训练不同域的多个数据集来学习生成多样化输出的统一框架,并研究了如何更好地提取域监督信息以学习更好的分离表征和实现更好的图像翻译的方法。实验表明,所提出的方法优于或与最先进的方法相当。
Nov, 2019
本文提出了一种基于层次生成方法和变分自编码器的无监督领域泛化算法,能够在不受领域特定信息约束的情况下学习表征并在多种领域设置下优于先前提出的领域泛化算法和现有的其他非生成式方法。另外,作者还提出了基于 ELBO 的模型选择和弱领域监督算法。
Jan, 2021