本文提出了一种不依赖于手动标注或数据领域知识的学习图像表示的方法,其实现了图像属性解离因素,其中每个因素代表一个一致的图像属性,这种解离后的特征可以应用于多种领域,例如将特定属性从一个图像转移到另一个图像、基于一个或多个属性进行分类或检索。这种方法中的自动编码器架构包括两个新的训练目标:不变性目标和分类目标,以确保每个特征块的编码对于其他属性是固定不变的,同时对于一致可辨的属性,避免出现完全被忽略的特征映射。实验验证了该方法在MNIST、Sprites和CelebA数据集上的有效性。
Nov, 2017
我们提出了一种被称为FactorVAE的方法,它可以无监督地学习从独立变化因素生成的数据中发现因素解耦的表示,并通过提供更好的解耦和重构质量之间的平衡得到改进。此外,我们还介绍了一个新的解耦评估度量,并阐明了常用的解耦评估度量存在的问题。
Feb, 2018
本研究提出了一种在深度生成模型中实现无监督的解缠结潜在表示的方法,通过在VAE的潜在空间中引入反Wishart先验来实现潜变量之间的统计独立性,能够在多个数据集上优于beta-VAE和与最先进的FactorVAE相竞争。
Sep, 2018
本文分析了无监督学习分离表示的最新进展并挑战了一些常见假设,通过实验研究发现,不加监督训练的模型很难达到良好的分离效果,同时,增加分离度似乎不会降低学习的样本复杂度,未来的研究应该关注归纳偏置和(隐式)监督的作用,考虑在多个数据集上复现实验结果。
Nov, 2018
本文提出了一个包含超过一百万张3D物体图像的数据集,以及在实验平台上运用机械臂移动物体的方式,以此来精确控制所有变化的因素,实现了不同解缠绕建模方法对模拟数据和真实数据的比对,研究结果表明模型选择是从模拟数据向真实数据传递信息的有效手段。
Jun, 2019
本文介绍了用于学习具有层次结构表示的权威因素的基准、算法和指标,解决了代表学习中处理多种组合的上下文相关性、不确定性等实际生产过程的挑战。
Feb, 2021
通过有限的监督训练,结合图像描述符技术(CLIP),在真实图像数据中标注和区分不同的变化因素,从而实现图像的去操纵处理。
Jun, 2021
本文介绍了一种基于条件互信息的对抗学习方法,实现了在考虑属性相关性情况下,对数据因素进行有效分离的目的,提高了模型的鲁棒性。
Dec, 2021
该研究提出可识别地探索嵌入空间的概念,是在没有人类标签的情况下,通过搜索训练的嵌入空间中可解释的概念,比如物体的形状或颜色来提供后续的决策解释。通过展示PCA和ICA能够恢复非高斯分布的独立概念,再提出两种基于图像生成模型可组合性的方法来恢复相关概念,该研究提供了没有人类标签可靠概念发现的坚实基础。
Jun, 2022
本论文研究多要素解缠的深度学习方法,结合Koopman自编码器,提出了一种基于谱损失函数的结构Koopman矩阵及解缠算法,支持多静态要素交换,并在标准基准测试中显着提高了解缠效果。
Mar, 2023