- 自然语言处理依赖于语言学
大型语言模型(LLMs)在某些语言中已经能够生成高度流畅的文本,而无需专门设计用于捕捉语法或语义连贯性的模块。对于自然语言处理中语言专长的未来意味着什么?我们强调几个方面,其中 NLP(仍然)依赖于语言学,或者语言学思维可以阐明新的方向。我 - 从语言学资讯中学习音位组合规则
使用与语言相关的数据来学习语法的互动学习方法,通过信息论策略选择询问或合成数据并从语言学者处获得反馈,有效率地实现语言学习。
- GRAMMAR: 领域指定的检索增强语言模型的基于语境和模块化的评估
评估检索增强生成 (Retrieval-augmented Generation, RAG) 系统面临独特的挑战,如领域特定查询及相应标准的匮乏、对故障案例原因的系统性诊断方法的缺乏等。为了解决这些问题,我们引入了 GRAMMAR (GRo - 跨语法的句法变异:建模复杂自适应系统
该研究利用整个语法以及语法中的独立节点对方言之间的句法差异进行了系统建模,结果表明句法变异的重要部分是语法不同部分之间的相互作用,并且方言之间的相似性严重依赖于被观察的语法子集。
- 只预训结构:利用迁移学习理解语言归纳偏差
本研究通过对语言模型进行先验的结构性偏置,探索了不同感性学习偏差的影响,并研究了三种感性偏差的相对成功:1)递归,分层处理的感性偏差;2)无法通过上下文自由文法建模的无限制令牌 - 令牌依赖的感性偏差;和 3)一个 Zipfian 幂律词汇 - 使用 T5 变压器模型进行孟加拉语语法错误检测
使用 T5 语言模型检测孟加拉语中的语法错误,经过 fine-tune 后在测试集上表现良好,仍需后处理以获得最佳性能。
- 语言的几何学
本文从几个角度综合了各种主张,提出了一种独特的语言学派,将数学几何观点引入到语法中,描述了一种基于几何学的机制,用于解释人类语言里的显著特征,并提出了一种新型的匹配方法,利用代表单词的标记链来形成句子,并匹配语法词序。最终得到的二维和三维结 - 将文本提炼为电路
本文利用 DisCoCirc 框架,提出了一种适用于自然语言的生成文本电路,该电路独立于语音和语言,并能够在不同表现层次上捕获和更新单词、句子和文本内涵,并通过构建混合语法和翻译过程,实现了文本生成和解析的循环互逆。
- 使用 CCG 分析和大型语言模型建模大脑中的结构构建
通过使用组合范畴语法(CCG)作为语法模型,研究人员发现可以更好地理解自然环境中语言理解的行为和神经相关性。使用 fMRI 收集参与者听故事期间的神经信号,研究发现 CCG 在解释神经信号方面的有效性优于上下文无关文法,并可以从可选附加语方 - DisCoCirc 的文本电路的语言无关性:英语和乌尔都语
本文提出了一种新的框架 DisCoCirc,用于使用组合、生成电路来表示文本的语法和语义,证明了针对英语和乌尔都语的限制性片段,DisCoCirc 在消除语言之间的语法差异方面起到了一定作用。
- MM为理解神经代码智能模型提供语法引导的程序简化
本研究探讨了一种基于语法引导的程序简化技术,该技术可识别输入程序中的关键特征,从而提高神经代码智能模型的透明度,并在多个模型及不同类型的输入程序上进行了多组实验。实验结果表明,该简化技术速度更快,提供的关键记号更少,并可用于生成高达 65% - KDD递归树语法自编码器
本研究提出了一种称为递归树语法自编码器 (RTG-AE) 的自编码器方法,这种方法利用自上而下解析器对树进行编码,利用树语法对树进行解码,两者都是通过递归神经网络进行学习,从而最小化变分自编码器损失。这种方法将变分自编码器、语法知识和递归处 - EMNLP统一的神经连贯模型
本文介绍了一种采用句子语法、句际连贯关系和全局连贯模式的统一一致性模型,该模型在局部和全局判别任务上表现良好,优于现有模型,并建立了新的最新技术成果。
- EMNLP通过对抗性干扰教授语法
介绍了几个基于 SNLI 或 FEVER 自然蕴涵示例的合成转换的数据集,用以教授语法和单词顺序等方面的知识;证明了多数流行的蕴涵模型没有意识到这些句法上的区别可改变含义,而强化训练后部分模型能够学习正确比较句法。
- EMNLP关于问答系统中提问结构的疑问
该研究通过 LIME 框架验证了哪些问题部分是获取有效答案所必需的,并发现语法和自然语言对于问答系统来说是不重要的,最新的模型即使只用 LIME 计算出的几个高系数单词也能正确回答问题。
- 一个编码器 - 解码器框架,将自然语言翻译为数据库查询
本研究考虑将自然语言转换成 SQL,用于关系数据库的数据检索。我们提出了一种新的编码 - 解码框架,包括新的语义特征和语法感知状态等新方法。实证评估结果表明,我们的方法在真实世界的数据库和查询上明显优于现有技术。
- 用于命名实体识别的图卷积网络
本文研究了依赖树在使用一组 GCN 的命名实体识别器中的作用。我们对不同的 NER 架构进行比较,并表明一句话的语法对结果产生积极影响。在 OntoNotes 数据集上的实验表明,在不需要大量特征工程或额外的语言特定知识的情况下,可以实现一 - 神经属性机用于程序生成
本文提出了神经属性机(NAM),并研究了其在生成结构复杂的序列方面的效果。NAM 利用逻辑机器表示潜在的语法,并通过优化定制损失函数来教导神经机器语法的约束条件,相比仅从语法样本中训练的传统 RNN,在生成时违规约束条件的情况更少。
- 对 2016 年美国总统竞选活动讲话的易读性分析
通过对候选人和历届总统发言文本运用 REAP 可读性分析,结合词汇和语法结构进行分析预测阅读难度等级,分析结果显示候选人在不同场合下的平均读易度、随时间变化的读易度和标准差,并与历届总统和葛底斯堡演说进行比较。
- MM环的右理想与科学的子语言
本文论述了科学的子语言与其嵌入语言中的特定代数关系,即环中的右理想。研究表明,这一理论不仅在生物免疫语言的文法研究中有着详尽而有意义的应用,而且还说明了语法的子块或子集与整个语言之间的数学关系。