Oct, 2023

基于距离加权的 Transformer 网络用于图像补全

TL;DR本文提出了一种新的架构,利用基于距离加权变换器的方法 (DWT) 来更好地理解图像组成部分之间的关系,并结合卷积神经网络 (CNNs) 和 DWT 块的优势来增强图像完成过程,通过编码全局依赖并计算基于距离加权的特征图,有效减少了视觉的歧义问题。同时,引入了残差快速傅里叶卷积 (Res-FFC) 块来结合编码器的跳跃特征与生成器提供的粗糙特征,进一步改进了对重复纹理的生成,同时还提出了一种简单有效的技术来归一化卷积的非零值,并通过细调网络层来规范梯度范数,提供了一个高效的训练稳定器。通过在三个具有挑战性的数据集上进行广泛的定量和定性实验,证明了我们提出的模型相比现有方法的优越性。