Nov, 2023

在 ViT 特征空间中解耦结构和外观

TL;DR我们提出了一种语义外观传输的方法,通过利用预先训练的和固定的视觉 Transformer(ViT)模型,提取深度 ViT 特征中结构和外观的新型解耦表示,然后通过 ViT 特征空间中的目标函数将这些表示相互编织在一起,提出了两种语义外观传输的框架 ——Splice 和 SpliceNet。