Sep, 2023

DeViL: 将视觉特征解码为语言

TL;DR我们提出了 DeViL 方法,该方法利用后续解释方法在深度神经网络决策过程中提供了自然语言描述,通过将视觉特征解码为语言,突显了不同层次的网络中视觉特征的归属位置,并在图像和文本之间进行转换,生成视觉网络不同层次的文本描述。