Oct, 2022

使用视觉 Transformer 进行细粒度的图片风格转换

TL;DR本文提出了一种新颖的 STTR 网络,采用视觉令牌将内容和样式映射到细粒度的特征空间,采用自注意力机制和交叉注意力机制实现微观的样式转换,在人造数据集的评估中取得了较高的效果。