Dec, 2023

多模态学习中的单模态偏差理论

TL;DR使用多输入流同时训练多模态神经网络在直觉上有优势,但在实践中具有挑战性。本文通过深度多模态线性网络的理论研究,揭示了联合训练中的单模态偏差问题,包括它与网络结构、数据统计和初始化的关系,以及它可能导致的泛化缺陷和永久性单模态偏差。此外,研究结果还表明,首先学习的模态未必对输出起更大的贡献。