字符级信息是否总是改善基于 DRS 的语义分析?
本论文提出,在序列到序列模型中,将字符级别和上下文语言模型表示相结合以提高 Discourse Representation Structure 解析的性能,并通过基于语义标签的新方法分析表明,字符级别表示改进了在选定语义现象的全部性能。
Nov, 2020
提出了一种基于 Neural 的序列到序列的语义解析器,它能够高准确率地产生英语句子的 DRSs,并通过引入 De Bruijn 索引消除变量名以提高解析器性能,以及加入银标注数据来进一步提高性能。
Oct, 2018
我们使用字符级翻译的方法对一大语料库中注释有抽象意义表示的句子进行神经语义解析的评估。通过一些简单的预处理和后处理,我们使用序列到序列模型得到了一个基线准确率为 53.1。研究了五种不同的方法来改善这个基线结果,结合这五种技术的结果使获得了一项 AMR 解析的最新进展状态的成果,F 分数为 71.0。
May, 2017
对于具备丰富形态的语言,采用神经模型进行解析时,在字符级别建模具有优势,因为字符级别模型可以学习到形态学特征。通过在 12 种形态学类型不同的语言上进行实验,我们发现字符级别模型在某些情况下无法准确区分单词,特别是在面对形态学变体方面。然后,我们证明了明确定义形态学格的显式建模可以改善我们的最佳模型,表明字符级别模型可以从定向的显式形态学建模中获益。
Aug, 2018
本文探讨了如何通过在不同语言中打标注的数据来学习语义解析器的分布式逻辑形式表示,以提高特定语言下单语义解析器的性能,并在标准的多语言 GeoQuery 数据集上得到了改进的结果。
Jun, 2018
本文分析了使用字符、单词和形态水平信息的 SRL 模型和字符级模型的性能,研究表明字符级模型比单词和形态更适合处理未知数据并具有高层次的语义分析能力。
May, 2018
本研究描述了一种仅依赖字符级输入的简单神经语言模型,该模型利用卷积神经网络和字符级公路网络作为输入,并将结果给予一种长短时记忆递归神经网络语言模型作为输出,该模型可以用较少的参数占据现有最先进的地位。此外,该模型表现出色的证明了许多语言所需的字符输入已经足够进行语言建模,且可以从字符组成的部分编码的单词表示中得到语义和字形信息。
Aug, 2015
该研究探讨了在使用基于子词分割的预训练语言模型(PLMs)中,字符级信息被编码的机制以及这些模型如何获得英语语言字符信息,结论表明这些模型可以很好地编码字符级信息并通过一系列实验证明这些结果是普遍适用的,并归纳了多种现象对于知识获取的作用,其中自然变化是其中之一
Jun, 2022
本文研究字符级别模式识别神经网络所学习的规律以及相对于手动标注的词语分割的重叠性,并使用卷积神经网络和双向长短期记忆网络对三种不同的语言进行形态标记任务的评估和比较,证明这些模型可以隐式地发现可理解的语言规则。
Aug, 2018
通过引入跨语言训练策略,深入分析和改进基于 Discourse Representation Structure(DRS)的语义表示分析模型,在英语、德语、意大利语和荷兰语的标准基准测试中取得了最先进的结果,并为未来的 DRS 分析研究提供了深入的见解。
Jun, 2024