- ACL基于潜在内部词结构建模的字符级中文依存句法分析
该论文提出了一种由词级依赖树转变为字级依赖解析的方法,通过模型化字内的潜在内部结构,在每个词级依赖树中解释为一棵以字级树为基础的森林,采用约束 Eisner 算法确保字级树的兼容性,确保了单一的字内结构根节点,并建立了这些根节点之间的词间依 - 中国金融文本情感挖掘:GCGTS -- 基于字符关系的同时提取方面 - 观点对的方法
通过使用图卷积网络 (GCN) 明确地融合句法结构和在同一句法语义单元 (中文词级) 内字符的编码,以及引入基于图像卷积的结构来捕捉评估单元内字符之间的局部关系,我们提出了一种创新的结构,该结构减少了对预训练语言模型的过度依赖,强调了结构和 - ACL通过语义重构在口语问答中回答未解决的问题
该研究分析了口头问答中的常见问题,并提出了一种基于语言学方法的 “语义问题改写” 模型,该模型通过修复、句法重塑和泛化等操作,使难以回答的问题变得易于回答,大幅提高了语音助手的准确性。
- ACL跨域关系抽取的银语法预训练
本文介绍了基于句法结构和语义之间的亲缘关系,并据此进行中间预训练的关系抽取模型。通过使用相关句法关系进行预训练,不需要额外标注的情况下,该模型在六个跨域设置中有五个比基线模型表现更好。
- LasUIE:使用潜在的自适应结构感知生成语言模型统一信息抽取
本研究旨在通过利用句法结构信息,提出一种新颖的结构感知生成式语言模型,对各种信息提取任务进行统一的建模与预测,并且通过引入异构结构感知器和任务导向的结构微调机制来实现更好的指导解码,从而显著提高了 12 项信息提取任务的性能。
- 人类语言的假观念:为何统计学需要语言学
研究语言处理的统计表面分布和基于句法信息的离散分层结构之间的紧张关系,揭示了只有反映句法结构的 surprisal 模型能够解释语言的规律性。
- ACL评估 Transformer 抽象语法表示的能力:基于远距离协议的对比分析
通过探究主谓和宾语 - 过去分词在法语中的形态一致问题,发现变形金刚模型对这两种形态一致问题的处理与应用于理论语言学中的模型一致,从而揭示了神经语言模型内部的工作机制。
- 句法依存距离的分布
本文提出了一种新的双指数模型,探讨了句子的句法结构和依赖距离分布及其与短期记忆限制之间的关系,并通过最近引入的优化分数,解释了最佳估计模型与句法依赖的紧密程度之间的关系。
- EMNLP代码语法理解语言模型基准测试
这篇论文介绍了作者对现有预训练编程语言模型在理解代码结构方面的限制进行了全面的基准测试,并引入了一个大规模的数据集 CodeSyntax 来评估这些模型的性能,并揭示了自然语言和编程语言在理解语法结构方面的差异和重要性。
- MM树的平面线性化中边长度期望和的线性时间计算
本篇文章研究依赖图的句法结构,针对平面的排列方法和投射的排列方法,分别提出了预期边长总和的计算方法,并用一个包含词语的句子来给出了平面排列的数量或生成平面随机排列的有效算法。
- 跨语言单词序变化反映了依赖性和信息局部性的进化压力
通过 80 种语言的语料和系统发展模型,研究说明了单个语言中词序变化的频率分布和演化,说明词序变异反映了语言在维持总体有效性方面优化竞争压力的不同方式。研究结果表明,语法结构和使用在有限的认知资源下相互协调以支持有效沟通。
- 神经语言模型中的成分结构探测
本文研究神经语言模型对句法结构的学习能力,发现预训练的 Transfomer LM 即使在语义有错的情况下仍能准确地代表不同类别的成分,并且语法信息确实被 LM 学习并与语义信息分离。
- 语言模型从其训练数据中复制了多少?使用 RAVEN 评估文本生成中的语言新颖性
RAVEN 是一组用于评估语言模型生成的文本新颖性的分析工具,使用这些工具对 LSTM, Transformer, Transformer-XL 和 GPT-2 等四个神经语言模型进行分析,发现 GPT-2 生成的文本在形态和语法上通常很好 - ACL使用结构化张量积表示丰富 Transformer 来进行抽象概括
本文介绍了一种在输入文档中识别关键信息并把它们组织成简短摘要的方法:使用增强型 Transformer 架构 TP-TRANSFORMER(Schlag et al.,2019),该架构通过引入 Tensor Product Represe - ACL非线性结构探针
在研究了线性探测器的限制条件后,我们针对六种语言提出了一种具有同样参数数量的非线性变体,并使用径向基函数(RBF)核函数进行了测试,发现在所有语言中,RBF 核函数与正则化相结合能够显著提高基线(Baseline)的性能。
- EMNLP高效信息传递和输入变异对神经代理迭代语言学习的影响
该研究发现,在使用神经网络代理进行迭代语言学习的近期模拟中,并不存在诸如词序或屈折等表达句法结构的不同策略间的权衡。然而,这一研究发现在考虑到偏向于高效传达、不系统的输入语言和学习瓶颈等三个因素后得到了重新评估,并发现神经网络代理主要努力保 - ACL句法规划在组合式图像字幕生成中的作用
本文研究了不同的方法,通过规划标题的句法结构来提高在图像说明中的组合泛化的能力。实验表明,同时建模标记和句法标签可以增强 RNN 和 Transformer 模型的泛化能力,同时提高标准指标的性能。
- ACL语法增强的预训练模型
文章提出了一种新的基于 Transformer 模型的句法感知注意力层以及预训练任务,该模型可以从句法结构中获取信息来提高预训练模型在关系分类、实体类型标注和问答等任务中的表现。实验结果表明,该模型取得了当前最好的表现效果。
- EMNLP新生语言的语法
本文使用无监督语法归纳技术分析参考游戏中出现的语言的句法属性,证明了这些技术适用于分析新兴语言,并研究了语言的出现是否具有句法结构,及其程度依赖于消息的最大长度和代理可以使用的符号数量。实验表明,需要一定的消息长度和词汇量,才能形成结构,但 - ACL利用句法结构改进语言模型:一种句法距离方法
本研究采用多任务学习方法,通过预测单词和语法距离(即基于真实解析树的距离值)的方式,相互共享中间表示,以有效且高效地融入句法结构于神经语言模型中, 实验表明,提供基于真实解析树的训练信号,能够降低困惑度并生成更好的语法树。