Aug, 2024

您想要什么?用户中心化的多轮指导文本到图像合成提示生成

TL;DR本研究针对文本到图像合成模型在用户提示质量和互动性方面的不足进行了探讨。提出的DialPrompt模型通过多轮对话的方式,允许用户在提示生成过程中表达偏好,从而提升了结果的可解释性和用户参与度。实验结果表明,DialPrompt在合成图像质量和用户中心性评分上均优于现有方案,具有显著的潜在应用价值。