- ICLR利用预训练生成模型的对比学习视角学习解耦表示
提出 DisCo 框架,通过利用预训练的生成模型的高生成质量和聚焦于发现作为解缠表示学习因素的遍历方向,从而实现学习解缠表示和发现区别性维度的最新进展。
- ICLR基于分组监督学习的零样本合成
本文提出了一种基于 Group-Supervised Learning (GSL) 的学习框架来解决神经网络关于视觉对象其他属性的 “想象” 问题,可以将输入分解为可替换的组件表示,并重新组合为新样本,从而实现高质量的零样本合成,并在相关基 - 面向计算病理学的解耦非监督表征学习
本文利用旋转等变卷积网络的群体结构扩展了变分自编码器框架,学习了组织病理学图像的方向无关性生成因素的分离表示,在减少影响的同时提高了单细胞图像子群聚合表示的性能。
- ECCV从面部图像学习解耦表情表示
本文使用对抗学习方法学习人脸图像的解缠表示,提高了在 AffectNet 数据集上表情识别任务的准确率。
- DSG-Net:学习 3D 形状生成的分离结构和几何
介绍了一种深度神经网络 DSG-Net,通过变分自编码器在分层结构上同时学习结构和几何形状,并使用条件部分 VAE 表示高质量的几何细节,从而实现了 D 形状生成的可控、高质量和可分离表示。
- CVPRS3VAE:自监督序列 VAE 进行特征解缕和数据生成
该论文提出了一种顺序变分自编码器,利用自监督方法,通过利用输入数据自身或外部模型提供的监督信号设计辅助任务,轻松将输入序列表示分解为静态因素和动态因素,并在视频和音频等领域的综合实验中证明其在表示分解和序列数据生成方面的有效性。
- 神经网络健壮性的因果视角
本论文提出了一种基于因果关系视角的神经网络输入鲁棒性分析方法,提出了深度因果操纵增强模型(CAMA),解决了单因素影响的问题,并采用了数据增强和测试时间微调方法以提升模型鲁棒性。相较于基于判别模型的深度学习神经网络,该模型表现出了更好的抵抗 - GMM-UNIT: 基于属性高斯混合模型的无监督多领域多模态图像转换
GMM-UNIT 基于分离内容 - 属性表示的方法,其中属性空间拟合了高斯混合模型,每个高斯混合模型组件代表一个域,它具有可以轻松扩展到大多数多域和多模态图像的优势,同时具有连续域编码,可以在域之间进行插值和外推,是用于无监督图像到图像翻译 - 高保真度分离表示合成
提出了一种基于信息提取的生成对抗网络框架(ID-GAN),可用于通过 VAE-based 模型学习分离表示,并将其提炼为生成高保真图像的 GAN 生成器。
- 通过解缠和自组装在随机潜空间上进行半监督学习
本文提出了一种结合半监督学习 (Semi-supervised learning, SSL) 和无监督分化表征学习的方法来增强自我聚合算法 (self-ensembling),并以多标签分类的方式在胸部 X 光图像上进行了验证。结果表明,该 - 基于生成对抗网络的分离化妆品转移
本文提出了 DMT (Disentangled Makeup Transfer),这是一种统一的生成对抗网络,可实现不同场景的化妆技术转移,它包含了一个身份编码器和一个化妆编码器来解缠非化妆人脸的个人身份和化妆风格,可产生具备高质量和可控功 - 解耦影响:使用解耦表示审计模型预测
本文提出了一种评估模型特征影响的新方法,利用消解表示来识别数据集中的代理特征,并显式计算特征对个体和聚合结果的影响,结果表明该方法比现有方法更加有效。
- 分解表示对抽象视觉推理有帮助吗?
本文通过大规模研究提供证据,证明在使用类似 Raven 渐进矩阵这样的抽象推理任务时,多个无监督的去卷积模型学到的分解表示模型比其他模型能够更快地学习并使用更少的样本,从而实现更好的下游性能表现。
- ICLR通过无监督的几何蒸馏解开内容和风格
本文提出了一种创新的框架,利用两个分支的自编码器来学习内容和风格分离的表征,并通过多个损失约束辅助无监督学习,最终生成清晰、高质量的 256*256 分辨率的图片。
- ECCVDRIT++: 基于解缠表示的多样化图像翻译
本文提供了一种基于解开表示的方法来解决无配对训练图像文件的生成任务的多输出问题,并且提出了一个固定内容空间和可变属性空间的嵌入方式来生成多样化的输出。通过定量和定性实验,论文证明了该方法可以在不需要配对训练数据的情况下,生成出多样而且逼真的 - 半监督学习下的属性指导非配对图像翻译
本研究针对虽然已受到广泛研究但是存在监督训练需求及缺乏编码域信息等问题的不配对图像转换(UIT)提出了一种称为 AGUIT 的属性引导 UIT 模型。AGUIT 通过使用新颖的半监督设置,共同考虑 UIT 的多模态和多域任务,在表示去耦和输 - 基于对称性的解缠表示学习需要与环境的交互
探寻在智能体在特定环境中的脱缰表示的一般公认的形式定义是对于构建数据有效的自主智能体的一个重要挑战。在群组理论基础上建立的基于对称性的脱缰表示学习是一种合理的定义,但其不能仅基于静态观测,而智能体应该与环境交互以发现其对称性。
- CVPR3D 人脸形状的解耦表示学习
本文介绍了一种设计三维人脸形状表征的新策略。通过将面部形状分解为身份部分和表情部分进行非线性编码和解码,利用属性分解框架对三维面孔网格进行表示,以更好地表示通常在彼此之间非线性变形的面孔形状。实验结果表明,我们的方法在分解身份和表情部分方面 - 多模态图像到图像转换的随机风格表示与相互信息损失
本文提出两种方法来提高多模态翻译质量,其一是通过来自源领域的内容表示以及目标域的风格表示的条件表示,其二是采用 MILO,一种基于信息论的新型随机定义的损失函数。我们的模型 MISO 在各种真实数据集上广泛实验,取得了最优性能。
- 无监督解缠的光谱正则化
通过对生成模型进行解缩表示,可以独立控制输出的不同方面,本文提出了一种基于奇异值分解的正则化方法,可以用来无监督地训练 GANs 生成具有独立控制的输出。