May, 2024

多模式提示下的用户友好定制生成

TL;DR本文提出了一种方法,用户只需提供每个定制主题的图像和文本,而不需要提供多张图像,通过引入 “多模态提示” 概念,将文本和图像相结合,简化用户交互,实现对对象和场景的精确定制。该方法在用户友好性和使用友好输入定制复杂对象方面超过了现有的基于微调方法。