Marpa 和可空符号
本研究旨在解决对未来序列数据的预测问题,提出将 Earley 解析器推广至未分段无标签序列数据,利用语言模型对最优的分段与标签进行预测,取得了显著的人类活动预测性能优于传统方法。
Jun, 2018
本文介绍了一种自然语言解析算法,它采用基于概率的评分函数来选择句子的最佳解析,并使用上下文为基础的概率来预测概率。该解析工具成功解决了诸如词性标注和单词歧义等问题,采用了不同于传统流水线架构的技术。
May, 1994
Parsel 是一个框架,它可以自动实现和验证复杂的算法,并将自然语言中的分层函数描述作为输入。这篇论文探讨了使用 Parsel 处理分层推理的各个领域,并展示了 LLM 生成 Parsel 代码后在 APPS 数据集上比直接采样 AlphaCode 和 Codex 有更高的通过率;还探讨了 Parsel 如何解决 LLM 的局限性并讨论了 Parsel 对于人类程序员的有用性。
Dec, 2022
本研究提出了一种贪心的从左到右的非投射转移句法分析器,旨在处理 AMR 图中的循环和重新进入,能够原生地处理重新进入和任意循环,模型在 LDC2015E86 语料库上获得 64%的 Smatch 的结果,并在重新进入的边缘上表现良好。
May, 2018
本文研究了面向神经符号推理的组合感知方法,涉及图预测的不确定性和推广性能,实现了在子图级别的细粒度神经符号推理,具有捕捉图形预测不同方面的神经和符号方法的独特优势,从而在领域间和尾部拥有良好的推广表现。
Jan, 2023
在形态丰富的语种中,通过一种新的 “翻转管道” 方法,直接在整个单词单元上进行专家分类器的决策,再综合其预测,从而在希伯来语词性标注和依存句法分析上取得了新的技术水平,并在其他希伯来语自然语言处理任务上接近最新技术水平。
Mar, 2024
本文提出了一种新的基于图的方法来进行语义解析,解决了文献中观察到的两个问题:(1) seq2seq 模型无法完成组合泛化任务;(2) 使用短语结构解析器的先前工作无法涵盖树库中观察到的所有语义解析。我们证明了两个优化算法的正确性,用基于约束平滑和条件渐变的方法近似解决这些推断问题。实验证明,我们的方法在 Geoquery、Scan 和 Clevr 上都具有最先进的效果,包括在测试组合泛化的过程中。
Feb, 2023
通过提供一种基于格点的表示,能够同时解决词法分割和句法分析任务的联合神经体系结构,在希伯来语等具有高度复杂性和模棱两可性的多词类语言上取得了最先进的性能。
Feb, 2024
该研究提出了一个基于神经编码器 - 解码器的转移句法分析器,可以作为关于最小递归语义的完全覆盖的语义图分析器,预测图与非词汇化谓词及其标记对齐共同。该分析器比注意力模型基准更准确,并且在 GPU 批处理方面比高精度基于语法的分析器快一个数量级。此外,我们的最小递归语义分析器的 86.69% Smatch 得分高于 AMR 分析的上限,这使得 MRS 成为有吸引力的语义表示选择。
Apr, 2017
提出了一种基于转换的方法,通过训练单个模型,可以有效地解析任何输入句子,支持连续 / 投影和不连续 / 非投影的句法结构,并证明了这两种句法形式可以在训练过程中互相受益,提高了在多个基准测试中的准确性,如英语和中文 Penn 树库以及德语 NEGRA 和 TIGER 数据集。
Sep, 2020