Apr, 2024

使用扩散视觉变换器解决遮蔽拼图难题

TL;DR利用扩散转换器生成基于可视内容的图像拼图或视频帧的位置信息,从而准确地组装拼图块,即使存在缺失块,该方法在多个数据集上达到了最先进的性能。