Sep, 2022

基于扩散的图像翻译:使用解缕分离的风格和内容表征

TL;DR本文提出了一种基于扩散的非监督图像转换方法,使用分离的风格和内容表征,并使用ViT模型中的中间键提取多头自注意层作为内容保存损失,并匹配文本驱动风格转移的[CLS]分类令牌,同时使用额外的CLIP损失,实验结果表明,该方法在文本引导和图像引导的转换任务中优于现有的基准模型。