- 迭代数据属性相互映射的可控数据生成
该论文提出了一个通用框架,以增强基于 VAE 的数据生成器的属性可控性和确保解缠。通过在训练集中对看到和未看到的数据进行优化,我们的目标在短时间内能够更精确地控制生成样本的属性,保证解缠并保持生成样本的有效性。
- ICCVSC2GAN: 自校正相关 GAN 空间重新思考纠缠
本研究探讨了生成对抗网络(GANs)中潜在空间的交错问题,并提出了一种新的框架 SC$^2$GAN 以实现解交错。通过重新投影原始潜在编码样本并根据高密度和低密度区域进行编辑方向的修正,利用原始的有意义方向和语义区域特定层插值原始潜在编码, - 流分解表示学习
流式因式分解表示学习是一个新颖的结构化表示学习视角,该模型通过动态最优输运的梯度场生成一组不同输入变换的潜在概率路径,并在标准表示学习基准上获得更高的似然度,同时接近于近似等变模型,具有鲁棒性和广泛适用性。
- 学习具有混合三维表示的分离化身
DELTA 采用混合的 3D 表示方法对人体进行建模,通过将网格与体积渲染相结合,实现了人体、服装和头发的解耦合,有效实现了重建、试穿和发型转换等应用。
- ICCV领域特异性引导变形器以实现无来源领域适应
在隐私导向的无源情况下,我们提出了一种使用视觉转换器进行领域适应的方法,通过构建领域可辨识输入(DRI),利用查询提取特定领域信息,并在统一模型中实现领域特异性和任务特异性的解耦和学习,实现了在单源、多源和多目标基准上的最先进性能。
- 衡量因果解缠对神经网络模型对抗鲁棒性的影响
量化研究表明,因果神经网络模型通过解耦因果和混淆信号,在对抗性攻击、少样本学习和罕见上下文分类等任务中表现出高的鲁棒性,但尚未进行定量研究以衡量这类因果模型所实现的解耦程度及其与对抗性鲁棒性的关系。本论文使用计算机视觉领域的内容 / 风格解 - ICCV针对有条件人脸编辑的自适应非线性潜式变换
本论文提出了一种名为 AdaTrans 的自适应非线性潜空间转换方法,可用于面部编辑过程中的解耦和有条件的编辑,能够实现面部特征的分离、非二元属性的编辑,具有高保真度,并能够消除属性之间的纠缠。
- 通过密度地标检测离散化潜在坐标系统的可辨识性
本文开发了一种新的不要求非独立性的、称为量化坐标可识别性的可识别性形式,并全面证明了离散坐标的恢复
- 3D-Speaker:用于语音表示分离的大规模多设备、多距离和多方言语料库
本研究介绍了一个大规模语音语料库 3D-Speaker,用于促进语音表征分离的研究。3D-Speaker 含有超过 10,000 个说话者的语音数据,包括不同距离、不同方言等多维度组合,适用于评估大型普适性语音模型的性能并尝试领域外学习和自 - 变分解缠图自编码器用于链接预测
本文提出了一种新的框架 —— 解缠图自编码器 (DGAE) 和变分解缠图自编码器 (VDGAE),利用解缠策略来提升链接预测的性能,该框架将表示解缠成对应于唯一潜在因素的多个通道,通过彼此独立的通道来增强不同潜在因素的独立性。
- 对解缠结定义的范畴论元分析
本文通过范畴论作为一个统一严密框架,元分析了现有的解缠结概念定义,并认为笛卡尔积和幺模乘积应作为解缠结的核心概念,从函数、等变映射、关系和随机映射的角度展示了不同处理方式的相似性和重要差异。
- AvatarReX: 实时表情丰富的全身虚拟形象
AvatarReX 是一种新的方法,通过学习基于 NeRF 的全身化身构建,提供可表达身体、手和脸部的控制,同时支持实时动画和渲染;采用合成的化身表示方式,将身体、手和脸部分别建模,并解耦几何和外观,进而实现了针对 DSLR 图像的渲染流程 - LEO:人体视频合成的生成式潜空间图像动画器
提出了一种名为 LEO 的新颖方法,通过将运动表示为一系列流场图,在生成过程中固有地分离运动和外貌,从而强调时空一致性,并取得了比以前方法更好的人类视频合成效果。
- StyleGenes:离散和高效的 GAN 潜在分布
本文提出了一种基于基因启发式模型的离散潜在分布,可以在保留最高水平的照片逼真度的同时,比广泛使用的 StyleMapping 网络实现更好的去关联性,实现了从先前无条件训练的模型中实现有条件采样。
- 视觉参考游戏推进分离表示的产生
本文研究了视觉指代游戏中深度学习中所学习的表示中的解缠,组合性及系统性之间的关系,并提出了一个基于 Obverter 架构的视觉指代游戏实现了更好的解缠表现。同时,作者还拓展了位置解缠和互信息差解缠指标,以更好地区分不同种类的组合语言,并研 - ICML生成模型中的潜在遍历作为潜在流
该研究的主要目的是通过使用学习的动态潜在地形建模潜在空间,以及受物理学和神经科学启发的偏微分方程,实现语义上有意义的潜在遍历,同时在模型训练中通过作为正则化项的方式,提高模型推断的准确性和结构化表示的学习。
- ALADIN-NST: 基于神经风格转换的自监督解缕编码学习艺术风格
我们的论文旨在学习一种视觉艺术风格的表示形式,该表示形式从语义内容中更强的解离出来,我们使用神经风格转换(NST)来测量和驱动学习信号,并在明确解离度量上实现了最先进的表示学习。我们表明,强调风格和内容的解离会在风格特定度量方面取得大量收益 - IJCAI通过稀疏因果干预分离潜在表示
通过将因果关系理论与矢量量化变分自编码器相结合,我们提出了一种新的基于因果动态的去纠缠方法,将量化向量视为因果变量并将其链接在因果图中,通过对因果图进行因果干预,引发影响图像中唯一变化因素的原子转换。同时,我们通过引入一个新的行动检索任务来 - ICLR通过 Hausdorff 分解支持关联因素解缠
本文提出了一种使用 Hausdorff 分解支持(HFS)标准的放松知识分离方法。这种方法在考虑因素的相关性时实现了对深度学习表示的分离,并在各种相关环境和基准测试中表现出色,对于现有的分离方法具有相对改进超过 60%的效果。
- GAN 能否听见?从扩散模型中重获无条件语音合成
AudioStyleGAN 是一个基于生成对抗网络的语音合成模型,利用噪声转换为分离的潜在向量,并引入新技术成功训练模型和实现不需要显式训练的语音转换和编辑,取得了 Google Speech Commands 数据集上的最佳效果。