通过直通估计器将逻辑约束注入神经网络

Jul, 2023

通过直通估计器将逻辑约束注入神经网络

Injecting Logical Constraints into Neural Networks via Straight-Through Estimators

Zhun Yang, Joohyung Lee, Chiyoun Park

TL;DR将离散逻辑约束注入神经网络学习是神经符号人工智能领域的主要挑战之一。本文发现，直通估算器这一用于训练二进制神经网络的方法可有效应用于将逻辑约束纳入神经网络学习中。我们设计了一种系统的方式将离散逻辑约束表示为一个损失函数；通过梯度下降，利用直通估算器最小化该损失函数可以使得神经网络的权重朝着使二值化输出满足逻辑约束的方向更新。实验结果表明，通过利用 GPU 和批次训练，这种方法比现有的需要进行大量符号计算来计算梯度的神经符号方法具有更好的可扩展性。此外，我们证明了该方法适用于不同类型的神经网络，如多层感知机（MLP）、卷积神经网络（CNN）和图神经网络（GNN），使它们能够通过直接从已知约束中学习来学习了无标签数据或更少标签数据。

Abstract

Injecting discrete logical constraints into neural network learning is one of the main challenges in neuro-symbolic ai. We find that a straight-t

neuro-symbolic ai logical constraints straight-through-estimator gradient descent neural networks

发现论文，激发创造

利用贝叶斯学习规则训练二值神经网络

本文提出了一种基于贝叶斯学习规则的方法来解决训练二进制神经网络的有限制的问题。该算法不仅能够获得最先进的性能，而且还能够估计不确定性以避免灾难性遗忘。

Feb, 2020

语义目标函数：向深度学习中添加逻辑约束的一种分布感知方法

通过结合逻辑和信息几何，我们提出了一种将知识嵌入和逻辑约束引入机器学习模型中的方法，通过构造分布并将其与原始损失函数以及费舍尔 - 劳距离或库尔巴克 - 莱布勒散度相结合构造损失函数，以输出概率分布来包含逻辑约束。

May, 2024

逻辑约束下的学习，但不满足快速通道

通过引入双变量来解决逻辑连接约束的快捷方式问题，将编码形式化为与模型的原始训练损失兼容的分布损失，实现学习逻辑约束的新框架在模型的普适性和约束满足方面表现出卓越的性能。

Mar, 2024

可扩展的深度学习与逻辑推理的耦合

本文介绍了一种可扩展的神经网络结构和损失函数，专门用于学习离散图形模型所表达的 NP-hard 解决问题的约束和标准，并在实践中证明其能够高效地从自然输入中学习如何解决 NP-hard 推理问题，具有数据效率，可解释性和后验控制。

May, 2023

具有逻辑约束的自回归模型的伪语义损失

神经符号人工智能（Neuro-symbolic AI）通过在神经网络的输出分布上最大化符号约束的可能性来弥合纯符号和神经学习方法之间的差距。为了应用神经符号学习于更具表达能力的自回归分布，例如转换器，我们提出了一种在随机的局部近似上对其进行约束的方法。我们的方法是分解的，允许重用子问题的解决方案，进而有效地计算神经符号误差，并且是局部的高保真度近似，具有低熵和 KL 散度，改进了基本模型预测逻辑一致输出的能力，也在大型语言模型去毒化任务方面取得了先进技术水平。

Dec, 2023

神经符号学习的语义强化

该论文探讨如何利用神经符号方法求解具有约束条件的优化问题，为此提出一种计算约束条件之间的互信息的方法，并在三个任务中进行了测试，证明了该方法在提高性能的同时，避免了计算上的复杂性。

Feb, 2023

解决向量量化网络中优化挑战的直通估计器问题

本文研究了在使用向量量化直通估计训练神经网络时所遇到的挑战，通过引入仿射重新参数化的过程和交替优化方法来改进模型性能。对多种模型结构和任务进行测试，包括 AlexNet，ResNet 和 ViT 以及图像分类和生成建模等领域。

May, 2023

逻辑约束下的深度学习

本文综述了利用逻辑指定的背景知识以获取性能更好、学习数据更少或保证符合背景知识的神经模型的研究，并根据表达背景知识的逻辑语言和实现目标进行分类。

May, 2022

具有逻辑神经网络的神经符号归纳逻辑编程

采用逻辑神经网络学习归纳逻辑规则，得出高度可解释且具有灵活参数化以适应数据的规则。

Dec, 2021

理解直通估计在训练激活量化神经网络中的作用

通过学习使用 STE 实现反向传播算法中的梯度下降，通过正确选择 STE 并验证其梯度与总体梯度正相关，进而解决了搜索负方向最小化训练损失的问题。研究还比较了不同 STE 算法对 CIFAR-10 数据集的训练结果和稳定性。

Mar, 2019