high-fidelity images | BriefGPT

关键词high-fidelity images

搜索结果 - 5

UNIMO-G：基于多模态条件扩散的统一图像生成
UNIMO-G 是一个简单的多模态条件扩散框架，能够对多模态提示进行操作，并展示了文本驱动和主体驱动图像生成的统一能力。该框架通过训练大规模文本 - 图像对，以及使用多模态提示进行指导微调，实现了高保真度的图像生成。
PDF5 months ago
光场扩散用于单视角新视角合成
单视角新视角合成是计算机视觉中一项重要而具有挑战性的任务。本文提出了一种基于条件扩散模型的 Light Field Diffusion，通过引入局部像素约束，鼓励更好的多视角一致性，实现高保真图像的生成。
PDF9 months ago
LayoutLLM-T2I: 从 LLM 中引导布局为文本到图像生成
本研究提出了一种从文本提示中合成与之语义对齐的高保真度图像的方法，采用了粗到细的范式来实现布局规划和图像生成，并通过粒度不同的目标交互扩散方法以优于现有方法的方式生成布局和图像。
PDFa year ago
CVPR使用定制扩散模型进行文本引导的图像编辑
该研究提出了一种名为 Custom-Edit 的文本导向图像编辑方法，使用少量参考图像进行模型自定义，可以显著提高引用相似性同时保持源相似性，适用于各种数据集。
PDFa year ago
变分梯度流深度生成学习
提出 VGrow 框架来学习深度生成模型，通过 $f$-divergence 进行梯度流，使用 logD-trick GAN 来作为新的目标函数评估不同的散度，结果表明 VGrow 可以生成高保真图像并且表现优异。
PDF5 years ago