Nov, 2023
在 ViT 特征空间中解耦结构和外观
Disentangling Structure and Appearance in ViT Feature Space
Narek Tumanyan, Omer Bar-Tal, Shir Amir, Shai Bagon, Tali Dekel
TL;DR我们提出了一种语义外观传输的方法,通过利用预先训练的和固定的视觉 Transformer(ViT)模型,提取深度 ViT 特征中结构和外观的新型解耦表示,然后通过 ViT 特征空间中的目标函数将这些表示相互编织在一起,提出了两种语义外观传输的框架 ——Splice 和 SpliceNet。