Dec, 2023

评估SATNet解决符号基础问题的能力

TL;DRSATNet是一个奖-winning的MAXSAT求解器,可以用来推断逻辑规则并作为深度神经网络中的可微分层。本文通过展示,在缺乏标识个别数独数字图像及其逻辑表示的中间标签的情况下,SATNet在视觉数独上彻底失败(0%的测试准确性),澄清了SATNet的能力。一般来说,这个失败可以归因于SATNet无法学会将符号分配给感知现象,也就是所谓的符号基础问题,这被认为是智能代理执行真实世界逻辑推理的先决条件。我们提出了基于MNIST的测试,作为符号基础问题的简单实例,可以作为可微分符号求解器的健全性检查。对于这个测试的SATNet的朴素应用导致性能比没有逻辑推理能力的模型更差。我们报告了SATNet失败的原因以及如何防止它们。