Dec, 2023

PhotoMaker: 通过堆叠身份嵌入定制逼真的人类照片

TL;DR研究对文本到图像的生成进行了进一步的提升,在保证高效率、有辨识度的身份和灵活文本控制性等要求的前提下,提出了 PhotoMaker 方法。通过将输入的身份图像编码为堆叠的 ID 嵌入来维护身份信息,该嵌入不仅可以全面地表达相同输入身份的特征,还可以适应不同身份的特征进行融合,从而实现更具吸引力和实用价值的应用。