Apr, 2024

IFViT: 基于 Vision Transformer 的指纹匹配解释性定长表示

TL;DR通过视觉转换器构建的可解释指纹匹配网络 IFViT,利用密集特征点在像素级别上进行准确匹配和构造固定长度表示,提供了具有解释性的像素级特征点对应,并在深度固定长度表示的指纹匹配中显著促进了可解释性。