基于数据的儿童 - 家长互动解析评估
本研究提出了一种名为 SCUD 的新的语言依存注释标准,并提供了 ConvBank 数据集,以用于在人机对话方面训练依存句法分析模型。实验表明,将模型预训练于公共数据集并在 ConvBank 数据上进行微调可以取得最好的结果,达到了 85.05%的未标注和 77.82%的标注连接准确率。
Sep, 2019
本文介绍了用 Universal Dependencies 分析 Tweets 的问题,提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义,并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。此外,作者还提出了一种新的方法来精简基于转换的解析器的集合,并在真实情况下验证了该方法的有效性。
Apr, 2018
该论文介绍了 Stanford 的 CoNLL 2018 UD 共享任务中的系统,这是一个完整的神经管道系统,可以将原始文本作为输入,并执行共享任务所需的所有任务,从分词和句子分割到词性标注和依赖关系解析,并通过广泛的消融研究展示了不同的模型组件的有效性。
Jan, 2019
直接依赖语音信号的句法分析被提出作为一种任务,该任务旨在将韵律信息纳入分析系统并绕过使用自动语音识别系统和句法分析器的管道方法的局限性。本文报告了一系列实验,旨在评估两种句法分析范式(基于图的分析和基于序列标注的分析)在语音分析中的性能。我们在一大型的法语口语树库上进行了评估,其中包含真实的自发对话。我们的研究结果表明,(i)基于图的方法在整体上获得了更好的结果,(ii)直接从语音中进行分析优于管道方法,尽管参数量少了 30%。
Jun, 2024
本研究提出了一种新的基于依存的混合树模型,将自然语言转换成机器可解释的含义表示,并通过在标准多语言 GeoQuery 数据集上进行的大量实验证明,我们的方法能够在多种语言上实现最先进的性能。
Sep, 2018
研究了汉语对话级别的依存分析,利用句法依存和修辞结构理论的思想,开发了一个人工注释的高质量语料库,探索了零样本和少样本场景,并考虑采用基于信号检测的方法将先前存在的句法依存转化为单元话语之间的未见依存的场景。通过单视图和多视图数据选择来获取可靠的伪标签实例,实验结果表明了这些基线的有效性。同时,我们还讨论了有关数据集和方法的几个关键点。
May, 2023
本研究使用神经叠加的方法,在 Universal Dependencies 方案下构建了 Singlish 依赖树库,并将英语语法知识整合到最新的 Singlish 依赖分析器中,结果显示英语知识可以减少 25% 的错误率,使分析器的准确度为 84.47%。我们是首次在低资源语言上使用神经叠加来改善跨语言依赖解析。我们会将我们的注释和分析器提供给进一步的研究。
May, 2017
介绍了 Uppsala 系统,它是一个由三个部分构成的流水线,可以用于 CoNLL 2018 共享任务的普遍依赖语法分析。通过使用多个树库对同一语言或密切相关语言训练模型,我们极大地减少了模型数量,最终在公开测试上获得了 LAS 和 MLAS 指标的第 7 位排名以及词分割、普遍 POS 标签和形态特征的最高分。
Sep, 2018
该论文介绍了 ADAPT 系统参加 2020 年 IWPT 共享任务的解析增强通用依存关系的方法,采用 UDPipe 和 UDPipe-future 构建管道方法,使用语义依存图解析器或一系列启发式规则来增强依存图,并在语言平均值方面达到了 79.53 分,可以成功实现增强依赖句法分析任务。
Sep, 2020
本文研究代码切换数据的句法分析,提出了规范化和反回译模型的解码过程,以及利用词性标注和句法树注释的神经堆叠模型。结果显示,我们的神经叠加分析器比增强分析模型优越 1.5%LAS 点,并且我们的解码过程比第一个最佳规范化和 / 或反回译提高了 3.8%LAS 点。
Apr, 2018