Oct, 2024

面向鲁棒多模态学习的掩蔽模态投影

TL;DR本研究针对多模态学习中缺失模态导致的性能下降问题,提出了一种新方法——掩蔽模态投影(MMP),旨在训练一个对任何缺失模态场景都鲁棒的单一模型。通过在训练过程中随机掩蔽部分模态,该方法有效学习如何利用现有模态的信息来补偿缺失模态,从而显著提高了模型在不同缺失模态场景下的鲁棒性。