CVPRApr, 2024

CA-Stream: 基于注意力池化的可解释图像识别

TL;DR基于 transformer 架构的注意力机制与交叉注意力流 (Cross-Attention Stream) 相结合,能提高模型的可解释性并保持识别性能。