May, 2024

耦合脉百加倍:耦合状态空间模型增强的多模态融合

TL;DR多模态融合的核心在于利用不同模态所固有的互补信息,然而现有的融合方法对于捕捉模态之间的复杂内部和相互关联动态缺乏充分准备,而最近在至关重要的状态空间模型 (SSM) 方面取得的进展,尤其是 Mamba 模型,成为有希望的竞争者,本文提出了耦合 SSM 模型来解决多种模态融合时的挑战,通过设计一个模态间隐藏状态转换方案以及并行计算的全局卷积核,实现多模态融合并在实验证实了其有效性。