pre-trained text-to-image models | BriefGPT

关键词pre-trained text-to-image models

搜索结果 - 4

CVPRTiNO-Edit: 时间步长和噪声优化用于稳健扩散式图像编辑
通过对噪音模式和扩散时间步进行优化，本文提出了基于 SD 的 TiNO-Edit 方法，其能够生成与原始图像更加吻合且符合预期结果的编辑结果，同时在 SD 的潜在域中提出了一组新的损失函数来加速优化过程。
PDF3 months ago
OpenLEAF: 开放领域的图文交替生成与评估
这项工作研究了一项名为开放域交错图像 - 文本生成的挑战性任务，该任务根据输入查询生成交错的文本和图像。我们提出了一种新的基于大型语言模型（LLMs）和预训练的文本到图像模型（T2I）的交错生成框架，即 OpenLEAF。在 OpenLEA
PDF9 months ago
教授文本到图像模型进行交流
通过语料上进行的实验结果证明，我们的方法有效且实用，能够生成与指定对话一致的逼真图像，并在多个度量指标上持续提高各种模型的性能。
PDF9 months ago
FaceChain：一个保留身份的肖像生成平台
FaceChain 是一个个性化肖像生成框架，结合一系列定制图像生成模型和丰富的与人脸相关的感知理解模型，通过只有少量肖像图像作为输入，解决了现有解决方案中产生真实细节的漏洞和包含扭曲、模糊或损坏区域的合成人脸问题。
PDF10 months ago