Oct, 2023

一体化:以单个 StyleGAN 向全领域翻译迈进

TL;DR我们提出了一种新颖的翻译模型 UniTranslator,用于在训练数据有限且视觉差异明显的情况下,在视觉差异明显的领域之间转换表示,主要思想是利用 CLIP 的领域中立能力作为桥接机制,同时利用独立模块从源领域和目标领域的嵌入中提取抽象的领域无关语义,将这些抽象语义与目标特定语义融合,实现在 CLIP 空间内的转换嵌入。UniTranslator 是通用且多功能的,能够在不同视觉领域的视觉挑战情景中执行多种任务,包括样式混合、风格化和翻译。值得注意的是,UniTranslator 生成高质量的翻译结果,展示了领域相关性、多样性和改进的图像质量。UniTranslator 超越了现有的通用模型的性能,并在代表性任务中表现良好。源代码和训练模型将向公众发布。