BriefGPT.xyz
Sep, 2022
基于扩散的图像翻译:使用解缕分离的风格和内容表征
Diffusion-based Image Translation using Disentangled Style and Content Representation
HTML
PDF
Gihyun Kwon, Jong Chul Ye
TL;DR
本文提出了一种基于扩散的非监督图像转换方法,使用分离的风格和内容表征,并使用ViT模型中的中间键提取多头自注意层作为内容保存损失,并匹配文本驱动风格转移的[CLS]分类令牌,同时使用额外的CLIP损失,实验结果表明,该方法在文本引导和图像引导的转换任务中优于现有的基准模型。
Abstract
diffusion-based
image translation
guided by semantic texts or a single target image has enabled flexible style transfer which is not limited to the specific domains. Unfortunately, due to the stochastic nature of
→