Apr, 2024

OneActor:通过群集条件引导实现一致的角色生成

TL;DR針對文本到圖像擴散模型中的一致性生成的挑戰,提出了一種輕量級但複雜的引導方法,通過引入後驗樣本來引導去噪軌跡向目標集群集中,並設計輔助組件來同時增強調整過程和規範推理,以提高生成圖像的內容多樣性。綜合實驗結果顯示,該方法在角色一致性、提示一致性和圖像質量方面都優於基線方法,並且比基於調整的基線方法至少快 4 倍。此外,首次證明語義空間具有與潛在空間相同的插值特性,可作為另一種精細生成控制的有希望工具。