Jan, 2024

ViTree: 專業化合成神經樹用於逐步解釋微細化視覺分類

TL;DR综合应用于各个领域的计算机视觉不断发展,对深度学习模型的可解释性提出了迫切要求。本研究提出了一种新颖的方法 ViTree,用于细粒度视觉分类,该方法将流行的视觉转换器作为特征提取骨干,与神经决策树相结合。通过遍历树路径,ViTree 有效地从转换器处理的特征中选择补丁,突出显示有信息的局部区域,从而逐步改进表示。相比于以前依赖软分布或路径集合的基于树的模型,ViTree 选择单一树路径,提供了更清晰简单的决策过程。这种补丁和路径选择性增强了 ViTree 模型的可解释性,使其能更好地理解模型的内部工作机制。经过广泛实验证明,这种简化的方法超越了各种强有力的竞争对手,并在维持卓越可解释性的同时取得了最新的性能,这一点通过多视角方法得到了证明。