May, 2024

可解释的张量融合

TL;DR传统机器学习方法主要用于基于单一数据类型进行预测,然而实际应用可能涉及各种类型的数据,如文本、图像和音频。我们引入了可解释的张量融合(InTense),这是一种多模态学习方法,用于训练神经网络同时学习多模态数据表示和其可解释的融合。InTense 能够分别捕捉不同数据类型的线性组合和乘法相互作用,从而解开高阶相互作用和每种模态的单独影响。InTense 通过给予模态和它们的关联以相关性得分,从而提供了可解释性。该方法在理论上有基础,并且在多个合成和真实数据集上得到了有意义的相关性得分。在六个真实世界数据集上的实验证明,InTense 在准确性和可解释性方面均优于现有的多模态可解释方法。