BriefGPT.xyz
Ask
alpha
关键词
multi-modal information bottleneck
搜索结果 - 1
图像文字表示的多模态信息瓶颈归因的视觉解释
通过多模态信息瓶颈(M2IB)方法,本文提出了一种改进视觉 - 语言预训练模型的可解释性的方法,学习将相关视觉和文本特征保留并压缩无关信息的潜在表示。在安全关键领域如医疗保健中应用 M2IB,展示了其在视觉 - 语言预训练模型的归因分析上提
→
PDF
6 months ago
Prev
Next