- 有条件的 Wasserstein 距离在贝叶斯 OT 流匹配中的应用
本文介绍了通过一组有限的耦合来定义条件 Wasserstein 距离,通过松弛条件 Wasserstein 距离来近似速度场,提出了 OT Flow Matching 的扩展,并展示了其在贝叶斯逆问题和条件图像生成中的数值优势。
- 条件生成模型足以从任何因果效应估计中进行抽样
通过条件生成模型的向前推导计算,我们展示了对于任意可识别因果效应的计算。基于此结果,我们设计了一种扩散基础的方法,在图像数据上从任意(条件)干预分布中采样。作为算法的应用,我们通过分析虚假相关性的强度和解耦的水平,对预先在 CelebA 数 - 引导式流生成建模与决策
使用非分类器引导的流匹配模型在条件图像生成和语音合成方面显著改善了样本质量,而且在计算量极低的情况下不会影响智能体的总体性能。
- Y - 对角耦合:用条件瓦砾均衡距离近似后验
逆问题中,通过最小化联合度量与其学习近似度量之间的距离,许多条件生成模型近似后验测度。尽管这种方法对于 KL 散度的情况也控制了后验测度之间的距离,但对于 Wasserstein 距离则不成立。我们引入一种带有一组受限耦合的条件 Wasse - 图像、3D 动画和视频的条件生成建模
通过探索条件生成模型的新的形式和在图像、3D 动画和视频中的创新应用,本论文试图在计算机视觉领域推动创新。我们的研究聚焦于提供噪声和视觉数据的可逆变换的体系结构,并应用编码器 - 解码器结构进行生成任务和 3D 内容操作。在所有情况下,我们 - 共形上下文鲁棒优化
基于数据驱动的方法预测后优化决策问题,使用非凸生成模型的情景预测区域构建了 Conformal-Predict-Then-Optimize(CPO)框架,保证了鲁棒性,并通过提供可视化的不确定性区域的语义化摘要,为最优决策提供了定性的直觉。
- 依赖数据耦合的随机插值
使用基于随机插值的框架将基本密度与目标密度进行耦合,构建了条件生成模型,从而实现了类标签或连续嵌入的信息传输,通过超分辨率和修复实验验证了构建相关联的耦合的实用性。
- ICCV引导扩散:一种泛化的插拔式条件图像合成框架
通过使用预先训练的逆模型设计的损失,利用扩散模型的生成控制能力,我们引入了 Steered Diffusion,这是一个通用的框架,用于实现基于扩散模型的逼真零样本条件图像生成,以在推理时引导扩散模型的图像生成过程。我们的实验表明,与最先进 - DomainStudio: 使用有限数据对领域驱动图像生成的扩散模型进行微调
本文提出了一种 DomainStudio 方法,用于将在大规模源数据集上预先训练的 DDPMs 调整到目标域,以在目标域中生成高质量且具有多样性的样本,从而实现无条件少样本图像生成。
- 适用于限价订单簿环境的条件生成器:可解释性、挑战和稳健性
本文研究了使用条件生成模型进行订单薄模拟的方法,通过使用对抗攻击探索了其对输入特征的依赖性,从而揭示了其优点和缺点,并展示了如何使用这些见解来改进 CGAN 模型的现实性和鲁棒性。
- 神经玻尔兹曼机
介绍了一种新型条件生成模型(Neural Boltzmann Machines),可以很好地解决噪声离散或连续数据,使用随机梯度下降法进行训练,尤其在正常分布数据方面表现优越。
- 使用深度条件生成模型从属性中学习结构化输出表示
本文使用深度条件生成模型的方法,提出一种针对属性控制的结构化输出表示形式,并使用 CelebA 数据集和 CUB-200-2011 数据集进行训练和生成。研究结果表明,使用 CVAE 框架可以学习到一种脱离关联的多模态先验分布,从而更好地生 - 可控制的图像生成:基于拼贴表现
本论文使用图像拼贴和对抗训练的方式,通过感知特征和空间位置控制元素,从而提高条件生成模型的场景可控性,并在 OpenImages 数据集上进行了实验验证。
- 利用生成深度学习和增材制造建模设计异质分层仿生蜘蛛网结构
我们使用深度学习模型基于关键几何参数来建模和合成人工的、仿生的三维蛛网结构,生成的模型能成功地构建满足设计目标的图形并大规模地将其组装成不同形态的结构。
- 通过公平干预与校正抽样打破条件生成的错误因果关系
为了解决生成模型中嵌入的虚假因果关系,本研究提出了一种基于两步策略的公平干预方法和校正采样方法,能够成功地解决各种数据集上生成样本中的虚假相关性问题。
- D2C: 用于少样本有条件生成的扩散去噪模型
本文描述了 Diffusion-Decoding (VAE) 模型,该模型使用经过学习的扩散先验来提高生成质量和对比自监督学习来提高表示质量,可以在仅有 100 个标记示例的情况下适应标记或约束条件的新生成任务,并在条件生成和图像操作中取得 - DeepFaceEditing: 利用分离的几何和外表控制实现人脸的深度生成和编辑
DeepFaceEditing 是一种针对面部图像的结构解缠框架,旨在支持面部生成和编辑,具有几何和外表的解缠控制能力。该方法采用了局部到全局的方法,将面部组件图像分解为几何和外貌表示,并使用全局融合模块进行一致融合,以提高生成质量,并利用 - 从单张图像中无监督生成新视角
本论文提出了一种基于生成对抗网络的条件生成模型,通过无监督学习实现在没有多视角、3D 和姿态监督的情况下进行从单一图像到新视角的合成。
- CVPR使用 MINE 的无偏辅助分类器 GANs
本研究提出了一种无偏的辅助生成对抗网络 (UAC-GAN),采用 Mutual Information Neural Estimator (MINE) 评估生成数据分布与标签之间的互信息,并基于投影的统计网络结构进一步提高了性能,在三个数据 - 双重循环一致对抗生成网络用于无监督条件生成
本文提出了一种新的无监督条件生成框架:双循环一致性条件生成对抗网络(DC3-GAN),该框架通过引入编码器 - 生成器对,使我们在避免生成过程低多样性和潜在特征平凡性的同时,也可以间接地估计真实条件分布,从而 提高聚类性能和分离性能。