面向能力的提示重组学习用于文本到图像生成
该研究提出了一种文本生成图像的自适应提示适配框架,该框架使用预训练语言模型进行有监督的微调,再使用强化学习探索更好的提示,通过奖励函数鼓励策略生成更具美感的图像,实验结果表明,自适应提示适配方法优于手动人工优化提示工程,预训练检查点已经公开发布。
Dec, 2022
Promptify是一个交互式系统,支持文本到图像生成模型的提示探索和细化,它利用大型语言模型提供的建议引擎帮助用户快速探索和构建不同的提示,其反馈循环可以迭代地细化提示并增强所需的特征,从而有效地促进文本到图像工作流程并在用户研究中优于现有的基准工具。
Apr, 2023
本文提出了两种基于提示生成框架的简单而有效的方法,以改善基于文本的图像编辑过程中用户工程的问题,并通过定性和定量实验证明了提示在基于文本的图像编辑中的重要性以及我们的方法可以与基于参考的提示相媲美。
Jun, 2023
开发有效的提示对于生成高质量图像的强大能力具有挑战性,因此本研究提出了PromptMagician,一个视觉分析系统,通过推荐模型和多层次可视化来帮助用户探索和优化生成图像的输入提示。研究通过用户研究和专家访谈证明了该系统的有效性和可用性,从而改善生成图文模型的创造力支持。
Jul, 2023
通过将T2I生成与模拟使用彩色绘画的交互相结合,PromptPaint使用户能够超越语言来混合表达具有挑战性概念的提示,从而允许他们在图像生成过程的不同画布区域和时间应用不同的提示,并提供了有关未来可操控生成工具的深入洞察。
Aug, 2023
我们提出并分析了一种直接改变提示嵌入而非提示文本的方法,将生成的文本到图像模型视为一个连续函数,并在图像空间和提示嵌入空间之间传递梯度,通过解决不同的用户交互问题,应用于优化图像空间的度量、在创造性任务中帮助用户导航图像空间以及包含用户在特定种子中看到但难以在提示中描述的信息等三种场景。实验证明了所描述方法的可行性。
Aug, 2023
通过构建Coarse-Fine Granularity Prompts数据集和User-Friendly Fine-Grained Text Generation框架,该研究提出了一种自动化提示优化方法,能够以更高的准确度生成视觉吸引力和多样性更强的图像。
Feb, 2024
通过混合倡议的多模态提示工程和细化,PromptCharm系统支持初学者用户在生成图像和优化载体过程中的生成式AI领域的最新进展,并通过可视化模型注意力值进行模型解释和反馈循环以提高生成图像的质量和用户期望的符合度。
Mar, 2024
本研究针对文本到图像合成模型在用户提示质量和互动性方面的不足进行了探讨。提出的DialPrompt模型通过多轮对话的方式,允许用户在提示生成过程中表达偏好,从而提升了结果的可解释性和用户参与度。实验结果表明,DialPrompt在合成图像质量和用户中心性评分上均优于现有方案,具有显著的潜在应用价值。
Aug, 2024