BriefGPT.xyz
Ask
alpha
关键词
pre-trained text-to-image models
搜索结果 - 4
CVPR
TiNO-Edit: 时间步长和噪声优化用于稳健扩散式图像编辑
通过对噪音模式和扩散时间步进行优化,本文提出了基于 SD 的 TiNO-Edit 方法,其能够生成与原始图像更加吻合且符合预期结果的编辑结果,同时在 SD 的潜在域中提出了一组新的损失函数来加速优化过程。
PDF
3 months ago
OpenLEAF: 开放领域的图文交替生成与评估
这项工作研究了一项名为开放域交错图像 - 文本生成的挑战性任务,该任务根据输入查询生成交错的文本和图像。我们提出了一种新的基于大型语言模型(LLMs)和预训练的文本到图像模型(T2I)的交错生成框架,即 OpenLEAF。在 OpenLEA
→
PDF
9 months ago
教授文本到图像模型进行交流
通过语料上进行的实验结果证明,我们的方法有效且实用,能够生成与指定对话一致的逼真图像,并在多个度量指标上持续提高各种模型的性能。
PDF
9 months ago
FaceChain:一个保留身份的肖像生成平台
FaceChain 是一个个性化肖像生成框架,结合一系列定制图像生成模型和丰富的与人脸相关的感知理解模型,通过只有少量肖像图像作为输入,解决了现有解决方案中产生真实细节的漏洞和包含扭曲、模糊或损坏区域的合成人脸问题。
PDF
10 months ago
Prev
Next