- COLING基于转移和序列标注分析的统一理论
我们定义了从自左向右读取句子的基于转移的解析算法到序列标注编码的句法树的映射。这不仅建立了基于转移的解析和序列标注解析之间的理论关系,而且提供了一种从不同形式的现有基于转移的解析器中获得快速简单的序列标注解析的新编码的方法。将其应用于依赖分 - EMNLP帕累托探测:以复杂度为代价平衡准确性
通过引入 Pareto hypervolume 作为评估度量和依赖文法分析作为更难的探针任务,从而探究探针评估下的文本语言结构和语义表示的性质和限制。
- EMNLP利用多语言 BERT、小语料库和小树库进行分析
本文提出在多语种低资源场景下采用语言特定的预训练和词汇扩充以适应多语种模型并使用所提出方法对四种语言进行案例研究,结果显示这些方法可以显著提高性能,特别是在最低资源的情况下,并证明了模型的预训练数据与目标语言变体之间的关系的重要性。
- ACLfastHan: 一个基于 BERT 的中文 NLP 多任务工具包
fastHan 是一个开源的工具包,提供中文自然语言处理的四个基本任务:中文分词,词性标注,命名实体识别和依存句法分析。使用一个基于裁剪 BERT 的多任务模型。fastHan 在 13 个任务上获得了接近最先进性能的结果,并且在依存句法和 - 基于大规模数据集的实用中文依存句法分析器
本研究介绍了 Baidu 依存分析器(DDParser),一个新的中文依存分析器,它是基于大规模手动标注数据集 ——Baidu 中文树库(DuCTB)训练的。DDParser 使用基于图的双仿射解析器,并对中文数据集的特征进行了调整,采用两 - IJCAI快速准确的神经 CRF 短语结构句法分析
本研究旨在提出一种快速准确的神经 CRF 成分句法分析器,采用内部算法批处理、边界表示和双仿射关注等手段,提高了句法分析的效率和性能,并在三个数据集上达到了最新的最高性能。
- ACL基于指针网络的基于转换的语义依存句法分析
通过使用 pointer networks 实现的转移句法分析器在依赖句法分析方面已经成为最新的技术水平,我们提出了一种基于指针网络的转移系统,可以直接生成标记有方向无环图并实现语义依赖分析。同时,我们使用从 BERT 提取的深层上下文化的 - MM从代数语言问题到程序:一种规范化方法
本文提出了一种将小学代数单词问题转化为正式语言 A-IMP 的程序的流程,使用自然语言处理工具将问题分解成句子片段,然后按照头动词和句子结构将函数分类,在文本中提取函数签名和参数,使用依赖解析,取得了整个流程的可用实现。
- AAAI解析作为预训练
本文讨论了使用预训练架构(而非解码)进行单语种全刻度句法分析(成分和依赖)的问题,并使用序列标注作为模型,探讨了不同词向量的句法敏感性。实验分析显示,使用预训练编码器的结果优于现有序列标记解析器,F1 评分为 93.5%(PTB)和 78. - EMNLP重新思考自注意力:朝向神经解析可解释性
本研究提出了标签关注层,一种新的自注意形式,其中关注头表示标签。运行实验并在 Penn Treebank(PTB)和中文 Treebank 上展示出其在词法句法分析方面的最新成果,标签关注层在该实验中表现出了更好的性能,相比现有工作需要较少 - 使用超标签特征的越南语基于转换的依存分析
通过利用超标记特征,利用基于转移的依赖句法分析方法来改善依赖分析,并在越南依赖树库上成功提高了正确附着率。
- EMNLP利用胶囊网络捕获语义角色标注中的参数交互
本文提出了一种基于 Capsule Networks 的 Semantic role labeling 方法,通过迭代更新 proposition embeddings 和结构预测,可以在维持高效的推断的同时实现 argument 之间的 - 无标签辅助语言的跨语言依存句法分析
本文中提出采用对抗性训练从辅助语言中提取无标注句子帮助学习跨语言不变表示,进而用于跨语言转移,通过实验证明,对抗性训练能有效提高依存句法分析的跨语言性能。
- EMNLP口语对话系统的依存句法分析
本研究提出了一种名为 SCUD 的新的语言依存注释标准,并提供了 ConvBank 数据集,以用于在人机对话方面训练依存句法分析模型。实验表明,将模型预训练于公共数据集并在 ConvBank 数据上进行微调可以取得最好的结果,达到了 85. - EMNLP层次化指针网络解析
本论文提出了一种基于层次指针网络的转移式解析方法,该方法在依赖和语篇关系解析方面具有优异的表现,超过现有方法并创造了新的最高水平。
- EMNLP转移和图形依存关系分析中的深度语境化词嵌入-重访两种解析器的故事
通过对十三种语言的依存句法分析实验进行误差分析,本文表明基于转移和基于图的依存句法分析器具有互补的优缺点,深层上下文词嵌入有利于转移依存句法分析器更好地利用其准确的局部决策,使得这两种方法在精度和误差概要方面几乎等效。
- ACLPenn Treebank 上的基于头驱动短语结构语法分析
该论文尝试将组成和依存句法两种形式融合到头驱动短语结构中,提出了两种基于所转换树的解析算法,成功地在 Penn Treebank(PTB)和中文 Penn Treebank 上实现了一种新型联合解码器,达到了本领域最高的解析性能。
- ACL跨表征学习的序列标注解析
本文将解析问题作为多任务学习来探究,通过添加解析范式作为辅助损失,在其他范式表现中保持一致提高性能,探讨了一种 MTL 序列标记模型,以几乎不损失性能和速度的代价解析两个表示,总体结果表明,平均来说,具有属于成分解析的辅助损失的 MTL 模 - ACL通过可逆投影的无监督适应实现跨语言句法转移
本文提出了一种生成模型,通过结构化的正则先验利用标记源数据和未标记目标数据联合学习源模型和目标模型的参数来解决在距离较远的语言之间跨语言迁移的问题,并使用可逆投影来学习一种新的公共嵌入空间,以对不完美的跨语言词嵌入输入进行补偿。该方法在使用 - ACL联合中文分词和依存句法分析的基于图的模型
本文提出了一种基于图形的模型来集成中文分词和依赖分析,相较于之前基于转移的联合模型,我们的模型更简洁,从而在中文分词和依赖分析方面取得了更好的性能,并且当结合 BERT 时,我们的模型可以显著减少联合模型和基于黄金分割词的模型之间的性能差距