- 语言学分析、描述与范畴语法的类型学探索 (TheBench 指南)
TheBench 是一个用于研究自然语言中的单调结构的工具,通过书写单调语法来探索分析,比较各种语言的类别,并从形式 - 意义对中训练语法模型,其中语法是潜在变量。
- 行动控制的改写
通过引入操作令牌作为用户预期行为的表示,结合文本嵌入进行表示融合,以实现受控改写;实验结果表明,在不给定操作时,我们的方法能够成功实现特定操作受控的改写,并与传统的非受控方法保持相同甚至更好的性能,从而促进了面向用户的可选操作控制概念。
- 移动测序器
探索语言和计划协作行动的共同起源,强调语义的变化史、发展、句法、传递和接收,以及语言行动的语义通过句法和规划来追踪和应对变化和不变。这一理念挑战了范畴的概念,语言学与计算机科学在其综合中具有重要意义,且对人类学产生了涉及扩展实践的影响。
- COLING融合词汇和句法知识的无监督跨语言迁移
本文提出了一种名为 “Lexicon-Syntax 增强多语言 BERT” 的新框架,该框架结合了词汇和句法知识,并通过多种技术增强其学习能力,在零样本跨语言传递的任务中取得了优异的成绩。
- 通过句法距离和地理邻近性探索语言关系
使用基于词性标注的三元组来计算语言间的语言距离,发现语言之间存在明确的族群和组群,且语言之间的相似性与地理距离呈显著相关。
- MMRFBES 在 SemEval-2024 任务 8 中的应用:探索用于区分人工智能生成和人类编写的文本的句法和语义特征
研究表明,利用大型语言模型可以高准确度地区分人工智能生成的文本和人类编写的文本,尤其在语义方面会更加有帮助,而句法方面还有改进的空间。
- 朝向视觉语法理解
通过改变自然图像的句法(例如交换一个脸部的眼睛和鼻子)来调查深度神经网络对此类句法异常的敏感性,并提出了一个三阶段框架来实现深度神经网络的视觉句法理解。通过使用类似于 BERT 的图像掩蔽自编码器进行训练,我们在 CelebA 和 AFHQ - 泰米尔语的形态与句法
这篇论文概述了泰米尔语的形态和句法,侧重于其当代用法,并强调了在形态和句法特征方面泰米尔语的复杂性和丰富性,这对于分析该语言和进行比较研究的语言学家有所帮助。此外,该论文对于开发泰米尔语的计算资源也非常有用。
- 深度 de Finetti:从大型语言模型中恢复主题分布
使用大型语言模型,我们发现它们能够生成结构完整且连贯的长文本,表明虽然这些模型是基于下一个词的预测进行训练的,但它们必须表示文档的潜在结构。本文研究了潜在主题结构作为文档结构的互补方面,通过将大型语言模型优化与隐性贝叶斯推断相连接来验证我们 - 大型语言模型对语法的理解程度如何?通过提问自然语言问题进行评估
通过语法学习角度探索大型语言模型对语言的理解,并发现语法学习在训练初期起到至关重要的作用,增加训练数据并非提高理解能力的灵丹妙药。
- EMNLPL2 语言学习的自动提取语法概念的教师感知
通过自动发现和可视化语法描述,本研究旨在帮助语言教育专家自动创建材料,以便教授印度语言中的语法和语义知识。
- 主观概率逻辑
本文讨论主观概率的语法和语义,其中语义决定了概率声明的测试方法。其中重要的变体包括对主客观概率的测试和支持思想的强有力概率获取了客观概率的特征。接下来介绍杰弗里斯法则,它指出两个成功的概率预测者必须发布相近的预测,从而支持客观概率的概念。最 - 具有语法感知的复数神经机器翻译
本研究提出了一种将语法信息与复数编码器 - 解码器结构相结合的方法,通过注意力机制从源端到目标端联合学习单词级和语法级注意力分数,可以直接集成到任何现有的序列到序列框架中,并在两组数据集上表现出很大的 BLEU 分数提高,特别是在具有显著语 - 从声音到语法:探究口语语言模型的句法
研究了自我监督和视觉基础的多个口语模型对句法的编码方式,证明句法结构被最明显地捕获在中间层,并在参数较多的模型中表现得更加明显。
- ChatGPT 在软件工程领域的适用范围:一次彻底调查
对 ChatGPT 在软件工程中的应用进行了研究,发现 ChatGPT 在代码的语法理解方面具有较高的能力,但在代码的语义理解方面,特别是动态语义方面存在困难,容易产生虚假输出。这表明在软件工程中使用 ChatGPT 时需要进一步探索验证其 - MD3: 多方言对话数据集
本文介绍了一个新的跨方言语音数据集,用于英语印度、尼日利亚和美国口音。该数据集通过提示参与者执行一系列短的信息分享任务来平衡开放式对话和面向任务的对话,以促进量化的跨方言比较,并避免对方言特征表现的限制性任务结构的强制性。初步分析表明该数据 - 从语音中提取基本语法:无监督深度神经网络中的自发串联
通过使用卷积神经网络实现基本语法的无监督建模,研究发现在音频输入数据中,即使没有用于多个字的数据,网络也能够生成具有两个或三个字的输出,并且这种训练的网络能够将词嵌入到新的未观察到的词组合中,为对这些结构的学习和语法应用提供了新的理解。
- 神经网络中的非确定性堆栈
本论文提出了将非确定性栈结构引入神经网络,通过可微分的数据结构实现非确定性下推自动机并将其融入循环神经网络和 Transformer 网络,从而提高其语法上下文无关语种的识别能力,并在自然语言建模方面进行了实证研究,并取得了不错的效果。
- ROSE: 一种用于语法的神经计算结构
本文提出了 ROSE 模型作为一种神经计算架构来处理自然语言处理中的语法问题,并使用神经振荡模拟大脑处理各种语言过程的机制。
- 无句法结构的言语行为:跨越斯金纳和乔姆斯基
探讨语言的本质及其生成语法对特定句法结构的授权方式等方面的问题,指出重新发现语言作为人类行为的本质并了解它的动态、社会、多模式、有意义、意图在于在他人和自己中促进可取的行动(或思维)可能可能指向语言的新的,可行的解决方案。