神经符号推理及构成不确定性量化用于图形自回归解析的鲁棒性
本文提出了一种新的基于图的方法来进行语义解析,解决了文献中观察到的两个问题:(1) seq2seq 模型无法完成组合泛化任务;(2) 使用短语结构解析器的先前工作无法涵盖树库中观察到的所有语义解析。我们证明了两个优化算法的正确性,用基于约束平滑和条件渐变的方法近似解决这些推断问题。实验证明,我们的方法在 Geoquery、Scan 和 Clevr 上都具有最先进的效果,包括在测试组合泛化的过程中。
Feb, 2023
该研究系统比较了序列到序列模型和基于组合原则的模型在 COGS 语料库上处理组合泛化能力的能力,在结构泛化任务中,基于序列的模型表现接近零,而组成模型在结构泛化任务中表现接近完美,这表明结构泛化是组成泛化的关键度量,需要能够处理复杂结构的模型。
Feb, 2022
探讨如何开发一种语义解析方法,既可应对自然语言变异,又能在组合推理方面具有强大的针对性。我们在非合成数据集上提出了新的训练和测试集分割,证明现有方法在广泛的测试中表现不佳。并提出了 NQG-T5,这是一个混合模型,结合了高精度的基于语法的方法和预先训练的序列到序列模型。它在非合成数据上的多个组合泛化挑战中优于现有方法,在标准评估上也具有竞争力。
Oct, 2020
通过引入神经符号堆栈机(Neural-Symbolic Stack Machine,NeSS),将神经网络的序列生成能力与符号堆栈机的递归支持相结合,解决了现有深度学习模型存在的组成泛化能力有限的问题。NeSS 在四个领域的测试中均获得了 100% 的组成泛化性能。
Aug, 2020
提出了一种基于 NSR 的神经符号递归机制,通过感知、语法解析和语义推理三个模块的联合学习来实现优越的系统化推广,并通过三个不同领域的基准测试取得了 state-of-the-art 的表现结果。
Oct, 2022
本研究旨在解决对未来序列数据的预测问题,提出将 Earley 解析器推广至未分段无标签序列数据,利用语言模型对最优的分段与标签进行预测,取得了显著的人类活动预测性能优于传统方法。
Jun, 2018
本文提出了 R&R,一种学习数据扩充方案,它通过基于原始训练示例的原型生成模型的重组和生成示例的重新采样来实现大类组合泛化,显著提高了普适性,尤其是在对罕见或看不见的子序列需要组合泛化的环境中,如指令跟踪(SCAN)和形态分析(SIGMORPHON 2018)。
Oct, 2020