Aug, 2024

StitchFusion:编织任意视觉模态以增强多模态语义分割

TL;DR本文解决了当前多模态语义分割方法在输入灵活性和训练参数数量上的限制。提出了一种名为StitchFusion的新框架,通过共享多模态视觉信息,实现了对任意视觉输入的综合特征融合。实验结果表明,该模型在四个多模态分割数据集上性能达到最先进水平,同时增加的参数极少。