- $O_2$ 是多重上下文无关文法:一种易实现、易形式化的证明
通过比较现有的证明,本文从计算和证明论的角度对多上下文无关文法 (MCFGs) 实现平衡语言的分析进行了系统研究,得出结论认为现有的证明都不适用于解决这个实际目标,并进一步提供了一种全新、基本、极短的证明方式。最后与现有证明进行了比较分析, - 将超参数搜索集成到 GramML 中
提出了 GramML 的扩展方法,支持更大的搜索空间,包括超参数搜索,通过 OpenML 基准测试发现与其他最新技术相比有显著的改进。
- EMNLP左角转换探索
该研究论文通过泛化之前的左角转换方法,支持半环加权产生规则,并提供了对可以移动的左角进行更精细控制的能力。该泛化的左角转换方法通过用右递归替换左递归,与猜测转换方法定义了等价的加权语言,同时在生成树结构上存在重要差异。除此之外,对 GLCT - LLM 的高效导向生成
使用正则表达式和上下文无关文法对语言模型的文本生成过程进行高效引导,通过 Outlines 开源 Python 库实现可行的引导生成。
- 语言模型的物理学:第 1 部分,无上下文语法
本研究设计实验以探究生成式语言模型如何学习上下文无关文法,并发现了 Transformer 如何利用物理机制隐式地编码文法结构、形成类动态规划的 attention,并在处理语法错误时表现出的鲁棒性方面的相关拓展。
- 技术报告:图神经网络进入语法领域
本文提出一种新的 GNN 设计策略,利用无上下文语法生成矩阵语言 MATLANG,从而确保 WL 表达能力,子结构计数能力和谱属性。根据该策略,设计了语法图神经网络 G$^2$N$^2$,证明了其在边级上计算长度为 6 的环并能够达到带通滤 - 在上下文无关文法约束下的隐藏马尔可夫模型中的边际推理查询
本文提出了一种计算隐马尔可夫模型中上下文无关文法概率的算法,解决了计算一类非二义性上下文无关文法概率的问题,并提出了一种可用于多项式绑定的二义性上下文无关文法概率的随机多项式算法。
- BenchCLAMP:语义解析语言模型评估基准
引入 BenchCLAMP,这是一种用于评估受限语言模型解析的基准测试,可通过提示或经过微调的语言模型的受限解码生成基于输入文本分析的语义输出。在 BenchCLAMP 中,为六个语义解析数据集提供了上下文无关文法,支持低、中、高三种资源分 - Astraea: 基于语法的公平性测试
该研究提出了一种基于语法的公平性测试方法(称为 ASTRAEA),它利用上下文无关语法生成具有歧视性的输入,从而揭示软件系统中的公平性违规,并通过模型再培训使软件的公平性提高了约 76%。
- MMClark-congruential 语言的决策问题
针对一类无上下文语法,研究了等价性的可决定性问题,证明了 Clark-congruential grammar 类中此问题是可决定的,同时考虑了如何检查 CFG 是否属于此类,并证明在给定 CFG 是 DCFG 的情况下此问题是可决的。
- 情感分类的统计分析框架
本文提出了一个基于统计语法分析的句子级情感分类框架,在此我们发展了一个统计分析器来直接分析句子的情感结构,并在上下文自由语法的基础上形成情感规则。我们训练情感分析器 s.parser,从用户评级的大量评论句子中直接获得情感极性标签,利用情感 - 量子自动机和量子文法
本研究将语言和自动机理论中的结构推广至量子情形,提出了量子有限状态自动机和下推自动机,以及正则文法和上下文无关文法的量子版本,在量子情形下得出了数个经典定理的类比,同时还证明了存在着非上下文无关的量子语言。
- COLING计算树语法概率消歧的计算复杂性
研究使用概率树 - 语法和上下文无关文法对消歧的计算复杂度,并证明计算最可能句法解析和最可能句子的问题是 NP-hard 问题。