- 渲染器是优秀的零样本表示学习器:探索扩散潜变量用于度量学习
本研究评估了现代生成式神经渲染模型的潜在空间是否可以作为具有三维感知的区分性视觉理解任务的表示,并使用检索作为度量学习属性的代理,发现 Shap-E 表示在零样本情况下优于经典 EfficientNet 基线表示,并且在使用对比损失训练两种 - 深度网络表示中的凸概念区域
本文探讨了测量人 - 机器对齐中机器学习的潜在空间中概念凸性的方法,并在多个应用领域的深度神经网络中评估了这种_convexity_。研究表明,类标签区域的预训练凸性预测了随后的微调表现。
- WeditGAN: 通过潜空间重新定位进行少样本图像生成
本文介绍了一种基于 WeditGAN 的 few-shot image generation 方法,利用常数偏移量编辑 StyleGANs 中的中间潜在层代码 w,通过重新定位源潜在空间的分布,构建目标潜在空间,成功地实现了模型转移,并在多 - ICML生成模型中的潜在遍历作为潜在流
该研究的主要目的是通过使用学习的动态潜在地形建模潜在空间,以及受物理学和神经科学启发的偏微分方程,实现语义上有意义的潜在遍历,同时在模型训练中通过作为正则化项的方式,提高模型推断的准确性和结构化表示的学习。
- ICLR水印图像在 ImageNet 中的危险
本文探讨了预训练网络在 ImageNet 数据集中学习水印模式的情况,发现不止卡通类别受到影响,还有诸如显示器、扫帚、围裙和保险箱等类别。最后,提出了一个简单的方法来缓解这个问题。
- ECCV跨模态三维形状生成与操作
该论文提出了一种通用的多模态生成模型,通过共享潜在空间将 2D 模态和隐式 3D 表示耦合在一起,实现了通过简单地传播来自特定 2D 控制模态的编辑,从而实现了多样化的 3D 生成和操作。
- 解缠的潜空间的语义不确定性区间
该论文提供了一种基于量化回归的方法来量化生成模型中语义信息潜空间在语义限制条件下的不确定性,从而为诸如图像超分辨率和图像完成等逆问题提供了可靠的,基于实例的,具有语义信息含义的不确定性可视化。
- 通过继承表征进行离散状态 - 行动抽象化
本文提出了一种自动学习基于状态抽象的离散化模型,命名为 Discrete State-Action Abstraction (DSAA),可以有效地解决强化学习中的任务,并且对探索方案的影响进行了模拟和验证。
- ICLRPandA: GAN 特征图中零监督学习部件和外观
提出了一种基于非负张量分解的无监督学习方法,通过发掘卷积神经网络特征图中表示空间部分和外观特征的因子,实现基于像素级控制的上下文感知局部图像编辑,并证明外观因子对应于显著性图,可以定位感兴趣的概念,具有比现有方法更高的准确性和更少的训练时间 - InsetGAN 全身图像生成
本文提出了一种组合多个预训练的 GAN 来生成全身人像的方法,其中一个 GAN 生成一个全局画布,专业的 GAN 产生细节部分,并通过共同探索各自的潜在空间来生成无缝连接的图像,我们通过定量评估和用户研究评估结果。
- 自监督潜空间中的图像水印
本文提出了一种基于自监督深度网络的数字水印嵌入方法,利用数据增强技术,将水印和二进制信息嵌入网络的潜在空间中,可以处理各种分辨率,抵抗旋转、剪裁、JPEG、对比度等多种转换,该方法的性能优于前面的零比特方法,并且多比特水印的性能与端到端训练 - CLIP2StyleGAN:无监督提取 StyleGAN 编辑方向
本文提出一种方法将 StyleGAN 和 CLIP 的预训练潜空间有效链接,从而能够自动从 StyleGAN 中提取语义标注的编辑方向,找到并命名有意义的编辑操作,而不需要任何额外的人类指导
- ICCV基于神经 ODE 的潜在变换应用于 GAN 图像编辑
本文研究在生成模型中,利用非线性的神经 ODE 来处理非纹理变化因素,挖掘潜在编码空间中的更多属性,并对大量具有已知属性的数据集进行实证研究。
- SurfEmb: 使用学习表面嵌入的密集连续对应分布进行物体姿态估计
该研究提出了一种使用无先验知识的数据学习物体表面上密集、连续的二维 - 三维对应分布的方法,并使用新方法进行刚性物体的六维姿态估计,该方法使用学习到的分布来采样、评分和改进姿势假设。
- StyleGAN 中用于细粒度图像操纵的特定属性控制单元
本研究提出了使用属性特定的控制单元来处理精细化的 StyleGAN 图像操作的方法,并针对人脸属性操作等任务进行了实证研究,结果表明该方法在实现精细操作方面表现出色。
- ICCVGAN 潜空间的视觉概念词汇
本文介绍了一种新的方法,针对生成对抗网络(GAN)中的潜在空间建立无限制的基元视觉概念词汇表,该方法通过三个组件实现:(1) 基于层选择自动识别知觉显著方向;(2) 人工注释这些方向以自由形式的组成自然语言描述,以及 (3) 将这些注释分解 - 通过操纵潜空间实现差分隐私成像
为了解决社交媒体、照片设备的普及,以及人脸识别系统的不断增加所带来的图像隐私问题,我们提出了一种基于未经条件训练的生成模型的潜在空间的图像混淆新方法,该方法能够合成高分辨率、逼真的面部图像,并以满足局部差分隐私的形式进行操作。据我们所知,这 - 控制性文本生成与聚焦变化
本文介绍了 FVN,它是一种新型的控制语言生成模型,通过学习代码本中每个属性的不同离散潜空间来解决以前的受控语言生成模型中的问题,并在两个文本生成数据集上进行评估和展示最佳表现。
- KDD文本增强领域自适应半监督协同过滤
利用领域自适应方法,将标注充足数据领域的知识迁移到充足数据缺失的领域,并通过对齐潜在向量空间和提取用户和物品的领域不变文本特征解决隐式反馈推荐系统中数据稀疏性的问题。三个真实数据集的结果表明,该方法优于现有算法。
- 可规划的 MDP 同态逼近:在行动下的等变性
该研究利用行动等变性原理进行表示学习,提出了一种对学习到的表示进行行动等变性限制的对比损失函数并证明了当损失函数为零时的决策过程是同态的。该方法能够获得效果更好的表示并具有更好的泛化能力。