Mar, 2024

音频 - 视觉个人验证的动态交叉注意力

TL;DR通过动态交叉注意力(DCA)模型,本文提出了一种能够根据音频和视觉模态之间的强弱互补关系动态选择跨模态关注或不关注特性的模型。实验证明该模型在多个跨模态注意力变体上表现出稳健性,同时优于现有方法的性能。