关键词generative text-to-image models
搜索结果 - 7
- 合成训练图像的未实现承诺:使用检索的真实图像性能更好
通过对比采用生成模型生成的人工数据和来自真实数据的有针对性图像进行微调,在任务上针对性生成的合成数据被真实数据普遍匹配或超越,这表明合成图像中存在生成器伪像和不准确的任务相关视觉细节。总体而言,我们认为在使用合成数据进行训练时,检索是一个必 - 严格保留 ID 和可控辅助广告图像生成
经过开发 Control-Net 的定制图像生成流程以及提出多分支交叉注意力架构,我们成功实现了面向电子商务广告场景的广告图像生成,确保生成的主题与所宣传的产品完美匹配,并实现了对生成模型面部的精细控制,展现了可控且引人注目的广告效果。
- 缓解文本到图像生成系统中的刻板偏见
本研究提出了一种总结生成文本到图像模型中的社会偏见并确保结果在不同人群之间公平的方法。我们通过在多样的文本提示下,用由各种民族、性别、职业、年龄组等组合构建的感知肤色和性别差异的合成数据对文本到图像模型进行微调,从而减轻了这种偏见。相较于基 - 公平的扩散模型是什么?设计生成文本到图像模型以融入不同世界观
通过 DiffusionWorldViewer 工具进行分析和操作生成图像模型的态度、价值观、故事和对影响其生成图像的世界的预期,从而改进了生成文本到图像模型的偏见缓解方法,并挑战了通常假设普遍世界观的公平概念。
- 稳定扩散提示的嵌入操纵
我们提出并分析了一种直接改变提示嵌入而非提示文本的方法,将生成的文本到图像模型视为一个连续函数,并在图像空间和提示嵌入空间之间传递梯度,通过解决不同的用户交互问题,应用于优化图像空间的度量、在创造性任务中帮助用户导航图像空间以及包含用户在特 - PromptMagician:文本到图像创作的交互式提示工程
开发有效的提示对于生成高质量图像的强大能力具有挑战性,因此本研究提出了 PromptMagician,一个视觉分析系统,通过推荐模型和多层次可视化来帮助用户探索和优化生成图像的输入提示。研究通过用户研究和专家访谈证明了该系统的有效性和可用性 - 公平扩散:教导文本到图像生成模型公平性
通过一项称为公平扩散的新策略,无需数据筛选和额外培训,即可在没有任何偏见的情况下指导生成模型的公平性和防止其加重偏见。