Sep, 2023

神经启发的多模态层次学习

TL;DR通过信息融合和处理各种来源或方式的信息对于获取综合准确的现实世界感知至关重要。我们从神经科学中获得灵感,开发了基于信息瓶颈概念的信息论层次感知(ITHP)模型。与大多数旨在将所有模态作为输入的传统融合模型不同,我们的模型将主模态定为输入,而其余模态则充当信息传递途径中的探测器。我们的感知模型专注于构建有效且紧凑的信息流,通过在潜变量状态与输入模态状态之间最小化互信息并在潜变量状态与其余模态状态之间最大化互信息之间取得平衡。这种方法导致紧凑的潜变量表示,保留相关信息并尽量减少冗余,从而显著提高了下游任务的性能。对 MUStARD 和 CMU-MOSI 数据集的实验评估表明,我们的模型在多模态学习场景中持续提炼关键信息,优于业界最先进的基准。