通过食物理解扩散概念代数的局限性
通过利用开源食品数据集和两种数据清洗方法开发的 FoodFusion 模型,能够以更真实和多样化的方式生成食品图像,填补了现有图像生成模型的不足。
Dec, 2023
基于条件扩散模型和聚类的训练框架,名为 ClusDiff,用于生成高质量和代表性食物图像,并用 Food-101 数据集进行评估,与现有的图像生成方法相比,性能有所提高;同时展示了 ClusDiff 生成的合成食物图像在 VFN-LT 数据集中有助于解决长尾食物分类中的严重类别不平衡问题。
Sep, 2023
通过结合多个提示进行图像生成的分散模型的构成性属性在本文中被利用,提出了对安全措施的攻击方法,并讨论了该发现对安全模型部署的影响。同时,也开启了对分散模型的概念算术和组合推理对安全机制的讨论。
Apr, 2024
本研究重新考虑扩散模型的总体框架,将其视为具有未观察到扩散轨迹的潜在变量模型,并应用于数据不受限制的领域。利用最大似然估计,我们表明模型构建和潜在路径的插补都可以构造扩散桥过程,实现端点的确定值和约束条件,并提供一套系统的研究和工具,进而提出了学习扩散生成模型的第一个理论误差分析和学习不同离散和受限领域数据的简单而统一的方法。实验证明,我们的方法在生成图像、语义分段和 3D 点云方面表现出色。
Aug, 2022
本研究介绍了一种基于文本的图像编辑方法,利用最新的扩散模型对一些基于文本主题的地方图像进行编辑,通过结合扩散模型的速度和 Blended Diffusion,提高了编辑的效率,并通过优化方法来解决扩散模型无法完美重建图像的问题,实现了比当前方法更高的精度和速度
Jun, 2022
通过自监督方法找到可解释的潜在方向,提出了一种简单的方法来缓解不合适的图像生成。进行了广泛实验证明了缓解方法的有效性,特别是对于公平生成、安全生成和负责任的文本增强生成。
Nov, 2023
这篇论文介绍了创造性文本到图像生成的任务,并使用未经研究的扩散先验模型来解决此问题,同时通过一个问题回答模型来逐渐发现越来越独特的创作,最后展示了先验约束不仅作为强大的混合机制,还能引入更多的灵活性。
Aug, 2023
通过结合潜在扩散模型和领域专用的大型语言模型,提出一种新颖的生成式视觉归因技术来生成异常图像的正常对应物,从而揭示医学图像中诊断相关的部分。通过在医学科学和应用放射学中获取的自然语言文本提示,使用图像先验和适当的条件机制来控制图像生成过程,利用 COVID-19 放射学数据库对结果进行实验和定量评估。
Jan, 2024