Jul, 2024

学习模态无关的语义分割表示

TL;DR通过从多模态视觉语言模型中进行知识蒸馏的方式,提出了一种新的学习无模态偏好表示的框架,该框架能够在任何视觉条件下结合任何模态并实现稳健的分割,实验证明其在多模态和模态不完整的情境下均达到了最先进水平。