扩展确定表达式的语法构建方法

Jan, 2023

Grammar construction methods for extended deterministic expressions

Xiaoying Mou, Haiming Chen

TL;DR本研究开发了扩展确定性表达式及其子类的语法定义，以完全解决长期存在的这类表达式没有语法定义的问题，从而消除限制其使用的重要原因。

Abstract

extended regular expressions with counting and interleaving are widely used in practice. However the related theoretical studies for this

发现论文，激发创造

本文研究了如何在学生写作中使用惯用表达，并使用真实数据创建了广泛的训练集和专家注释的测试集，最终通过多种方法评估了其性能并将其与人类专家进行比较。

May, 2023

本论文提出了将非确定性栈结构引入神经网络，通过可微分的数据结构实现非确定性下推自动机并将其融入循环神经网络和 Transformer 网络，从而提高其语法上下文无关语种的识别能力，并在自然语言建模方面进行了实证研究，并取得了不错的效果。

Apr, 2023

本研究提出了一个综合自然语言描述和示例的正则表达式合成框架，其中语义解析器将自然语言描述映射到包含空洞的中间草图，然后程序合成器搜索草图定义的正则表达式空间并找到符合给定字符串示例的正则表达式，该系统在先前数据集和现实世界中表现出最高的性能。

Aug, 2019

该研究旨在探索将自然语言查询翻译成代表它们含义的正则表达式的任务。为了充分发挥神经模型的潜力，该研究提出了一种收集大规模的正则表达式和自然语言对的方法，并通过该模型实现了比之前最先进模型提升了 19.6% 的性能。

Aug, 2016

本研究旨在模型理论中建立存在规则语言的模型论特性，如嵌入依赖项，元组生成依赖项和线性依赖项，并确定它们的复杂度限制。

Jan, 2020

我们的研究引入了正则表达式指令（REI），通过基于指令的机制来充分利用正则表达式的优势以统一地建模各种约束，支持多种常见的细粒度可控生成约束，并对它们的复杂组合进行建模。实验证明，我们的简单方法在各种约束下都能取得很高的成功率和适应性，并且在自动评估指标方面具有竞争力，并优于大多数之前的基准模型。

Sep, 2023

本文广义了 Bar-Hille 构造，使其能够正确计算包含 epsilon 弧的自动机的交集，并证明该广义构造导致一个编码输入自动机和文法结构的文法，同时保留原始构造的渐近大小。

Sep, 2022

引入了一个可以区分树结构的图多项式来表达依存语法，并基于多项式表示引入了一种量化句子语法相似度的方法。通过将这个基于多项式的方法运用到分析并比较不同语言中的句子与其翻译之间的句法以及在已有语料库中进行语法学的类型学研究，最后探讨并展示了这种方法在衡量语料库的句法多样性方面的潜力。

Nov, 2022

介绍了一种用于处理非连贯现象的有限状态转换器的新技术，通过将正则表达式编译器重新应用到其自身的输出来实现，该算法称为编译替换，并在马来语全干重复和阿拉伯语干部分插入上进行了演示。

Jun, 2000

本文研究有限状态自动机、正则表达式匹配、模式识别和指数级扩张问题，在复杂的正则语言类别中提出了理论和硬件解决方案，解决了网络入侵检测系统工作中的严重限制问题，并通过正确性和复杂性定理支持该解决方案。

Aug, 2023