通过食物理解扩散概念代数的局限性

Jun, 2024

通过食物理解扩散概念代数的局限性

Understanding the Limitations of Diffusion Concept Algebra Through Food

E. Zhixuan Zeng, Yuhao Chen, Alexander Wong

TL;DR通过食品图像领域的研究，我们分析了一个横跨概念的技术中的定性和定量模式，揭示了模型捕捉和表示烹饪多样性的能力以及模型偏见和限制的存在。

Abstract

image generation techniques, particularly latent diffusion models, have exploded in popularity in recent years. Many techniques have been developed to manipulate and clarify the →

image generation techniques latent diffusion models semantic concepts food domain culinary diversity

发现论文，激发创造

FoodFusion：一种用于逼真食物图像生成的潜在扩散模型

通过利用开源食品数据集和两种数据清洗方法开发的 FoodFusion 模型，能够以更真实和多样化的方式生成食品图像，填补了现有图像生成模型的不足。

Dec, 2023

基于聚类的条件扩散模型用于食物图像生成

基于条件扩散模型和聚类的训练框架，名为 ClusDiff，用于生成高质量和代表性食物图像，并用 Food-101 数据集进行评估，与现有的图像生成方法相比，性能有所提高；同时展示了 ClusDiff 生成的合成食物图像在 VFN-LT 数据集中有助于解决长尾食物分类中的严重类别不平衡问题。

Sep, 2023

用于克服扩散模型中概念抑制的概念算术

通过结合多个提示进行图像生成的分散模型的构成性属性在本文中被利用，提出了对安全措施的攻击方法，并讨论了该发现对安全模型部署的影响。同时，也开启了对分散模型的概念算术和组合推理对安全机制的讨论。

Apr, 2024

多样扩散：提升文本到图像生成中的图像多样性

通过增加图像多样性，我们的方法有助于创造更具包容性和代表性的人工智能生成艺术。

Oct, 2023

构建桥梁：理解和扩展扩散生成模型

本研究重新考虑扩散模型的总体框架，将其视为具有未观察到扩散轨迹的潜在变量模型，并应用于数据不受限制的领域。利用最大似然估计，我们表明模型构建和潜在路径的插补都可以构造扩散桥过程，实现端点的确定值和约束条件，并提供一套系统的研究和工具，进而提出了学习扩散生成模型的第一个理论误差分析和学习不同离散和受限领域数据的简单而统一的方法。实验证明，我们的方法在生成图像、语义分段和 3D 点云方面表现出色。

Aug, 2022

艺术生成的扩散式创意探索

利用最新的扩散模型生成创意艺术，通过将文本文档与粗略草图作为辅助信息进行模型训练，取得了令人满意的实验结果。

Jul, 2023

混合潜在扩散

本研究介绍了一种基于文本的图像编辑方法，利用最新的扩散模型对一些基于文本主题的地方图像进行编辑，通过结合扩散模型的速度和 Blended Diffusion，提高了编辑的效率，并通过优化方法来解决扩散模型无法完美重建图像的问题，实现了比当前方法更高的精度和速度

Jun, 2022

自我发现可解释的扩散潜在方向用于负责任的文本到图像生成

通过自监督方法找到可解释的潜在方向，提出了一种简单的方法来缓解不合适的图像生成。进行了广泛实验证明了缓解方法的有效性，特别是对于公平生成、安全生成和负责任的文本增强生成。

Nov, 2023

ConceptLab：使用扩散先验约束的创造性生成

这篇论文介绍了创造性文本到图像生成的任务，并使用未经研究的扩散先验模型来解决此问题，同时通过一个问题回答模型来逐渐发现越来越独特的创作，最后展示了先验约束不仅作为强大的混合机制，还能引入更多的灵活性。

Aug, 2023

VALD-MD：用于医学诊断的潜在扩散视觉归因

通过结合潜在扩散模型和领域专用的大型语言模型，提出一种新颖的生成式视觉归因技术来生成异常图像的正常对应物，从而揭示医学图像中诊断相关的部分。通过在医学科学和应用放射学中获取的自然语言文本提示，使用图像先验和适当的条件机制来控制图像生成过程，利用 COVID-19 放射学数据库对结果进行实验和定量评估。

Jan, 2024