Mar, 2024

基于概念的神经网络分析:视觉 - 语言模型

TL;DR通过多模态的视觉 - 语言基础模型作为一种视角,本文提出了一种逻辑规范语言 Con_spec,用于在这些模型的高级人类可理解概念描述的基础上编写规范并进行形式验证,通过采用 VLM 实现自然语言性质的编码和高效检查,以 ResNet 为基础的分类器在 RIVAL-10 数据集上进行的实验验证了我们的技术。