Jul, 2024

TransferAttn:可传递引导的注意力是视频领域自适应的必需

TL;DR使用转换器图层作为特征编码器,将空间和时间的可传递性关系融入到注意机制中,提出了 TransferAttn 框架以适应不同骨干的跨领域知识,通过改变自注意机制为可传递性注意机制,引入 DTAB 模块来增加 ViT 的可传递性,验证了 TransferAttn 和 DTAB 在多个数据集和不同骨干下的有效性。