Jun, 2021

多模态融合中的注意力瓶颈

TL;DR本篇论文介绍了一种基于transformer的新颖架构,使用多层的融合瓶颈来进行多模态融合,实现了在多个音视频分类基准测试上的最新的结果,同时降低了计算成本。