- 扩散生命周期之树:演化嵌入来理解扩散模型的生成过程
通过 Tree of Diffusion Life(TDL)方法,对扩散模型的生成空间进行采样并利用图像编码器从这些样本中提取语义含义,借助一种新颖的演化嵌入算法明确编码迭代过程并保留高维关系,从而实现对数据演化的可视化,简化了对扩散模型数 - 隐式图像到图像的 Schrödinger 桥在 CT 超分辨率和去噪中的应用
通过引入腐蚀图像的非马尔科夫过程,将生成过程转化为隐式图像到图像的 Schr"odinger Bridge 过程,提出了一个改进的 I3SB 方法,该方法能够使用少量的生成步骤生成具有更好纹理恢复的图像,并在 CT 超分辨率和去噪任务中验证 - CVPR文本引导的可探索式图像超分辨率
本文介绍了零样本文本引导下的开放领域图像超分辨率探索问题,提出了两种零样本文本引导超分辨率的方法,涉及生成过程、扩散模型和恢复方法,实现了匹配语义意义并保持数据一致性的多样解决方案,优化了极端超分辨率任务的恢复质量、多样性和可探索性。
- 图像恢复的扩散后验近端采样
本文介绍了一种通过扩展扩散模型进行图像修复的新方法,该方法利用生成过程中与测量身份一致的样本,并结合测量信号与初始化信息来提高生成过程的效果。实验证明了该方法在不同的图像修复任务中的有效性。
- 从自注意力到马尔可夫模型:揭示生成变换器的动力学
通过研究自注意力模型与马尔科夫模型的等价关系,我们建立了一种简单而强大的框架来研究自注意力及其特性。
- MimicDiffusion:通过模仿清洁扩散模型净化对抗扰动
基于扩散的对抗净化技术 MimicDiffusion 直接近似扩散模型的生成过程,以清晰图像作为输入,通过分析使用清晰图像和对抗样本时的引导项的差异,通过曼哈顿距离和两种引导策略净化对抗扰动,逼近清晰扩散模型,实验证明 MimicDiffu - 基于变压器模型的回归混合模型的最优学习
通过研究 transformers 在混合回归问题中的表现,我们发现它可以学习到一个最优预测器,在数据生成过程中表现出低均方误差,并且在推断时做出接近最优的预测。同时,我们证明了最优预测器可以通过 transformer 实现。
- 形状优化中的异常检测和设计空间降维的生成模型
我们的研究提出了一种新的形状优化方法,通过减少定义新的减少子空间的原始设计变量的数量,并通过概率线性潜变量模型(如因子分析和概率主成分分析)对数据的生成过程建模,以提高全局优化算法的效率,并在优化过程中生成没有几何异常的高质量设计。
- 反向稳定扩散:生成此图像所使用的提示是什么?
预测生成式扩散模型所生成图像的文本提示,采用联合回归和多标签词汇分类目标的新型学习框架,结合白盒和黑盒模型解决生成文本提示的问题,并通过课程学习和领域自适应核学习方法进一步改进。实验结果表明,该学习框架在预测文本提示任务上取得了出色的结果, - DreamSparse: 基于 2D 扩散模型的稀疏视角逃离柏拉图的洞穴
本研究中,我们探讨了如何在缺乏信息情况下,运用预先训练的扩散模型来合成全新视角的高质量图像,提出了 DreamSparse 框架,并利用几何模块来抓取 3D 特征,将其转化成空间信息来指导生成过程,并通过改进 2D 扩散模型的方式来保证其生 - ICLR目标感知分子生成和亲和力预测的 3D 等变扩散
本研究基于 3D 等变扩散模型实现有标的分子设计,并提出了一种综合的评估框架来评估样本分子的质量,实验结果表明,该模型能够更好地生成具有更逼真的 3D 结构和更好的与蛋白靶点的亲和力,而且在不重新训练的情况下能够提高结合亲和力排名和预测质量 - DiffBP: 用于靶向蛋白结合的三维分子生成扩散
利用基于蛋白质为环境约束的扩散模型,在非自回归的完整原子水平上,去噪元素类型和整个分子的三维坐标,学习生成过程,相较其他方法具有更高的相似性和更适当的分子大小以及其他药物性质。
- ICLR扩散模型已经具有语义潜空间
通过对预训练扩散模型进行不对称反演处理(Asyrp),我们提出了一种名为 h-space 的语义潜空间,它具有良好的属性,可用于语义图像操作。此方法适用于各种架构(DDPM ++,iD-DPM 和 ADM)和数据集(CelebA-HQ,AF - 利用潜空间知识分解和共享进行数据集压缩
本文提出了一种新方法,通过利用给定数据集中的规律,以生成模型的方式定义数据集,通过学习可压缩代码的潜在空间和解码器,可以显著地增加合成例子的数量并实现信息因式分解,从而在压缩比与生成质量之间提供更好的平衡。
- ICML移动健康结构化核函数在线选择
针对移动健康中高效、个性化学习的需求,我们研究了 Gaussian 过程回归中多任务在线核选择问题,提出了一种基于核组合的生成过程方法。我们的方法表明核演化轨迹可以在用户之间进行转移以改善学习,并且核本身对于 mHealth 预测目标具有意 - ICLR使用一般不可压流网络 (GIN) 和非线性 ICA 进行解缠
该研究延伸了 Khemakhem 等人在非线性 ICA 方面的重大成果,并应用于真实世界数据。研究表明,通过修改 RealNVP 不可逆神经网络体系结构,可以在一定程度上自动地将信息性的潜在变量从噪声中分离出来,并与生成过程的真实潜在变量一 - 用于生长图的生成图卷积网络
本研究提出了一种统一的生成图卷积网络,通过从现有图数据构建生成图序列的采样,在生成模型框架中自适应地学习所有节点的节点表示,同时使用图重构项和自适应 KL 正则化项对变分下限进行优化,解决了无法处理孤立新节点的问题。
- ECCV基于流场的静态图像空时视频预测
本研究探讨基于单张静态图片生成连续多个未来视频帧的问题,提出了基于多流模型预测和合成的方法。通过 3D 卷积学习了空间 - 时间关系,预测的结果更加接近真实视频的流形形态,相比现有方法性能更好、多样性更强且能获得更高的人类视觉评估。
- IJCAISAR: 推荐系统的语义分析
本文提出了一种基于语义分析和生成模型的推荐系统方法(SAR),能够从用户评分数据中学习出用户和物品的语义表示,并通过语义匹配得出更精准的推荐结果,实验证明 SAR 大幅优于其他同类算法。