字符级信息是否总是改善基于 DRS 的语义分析？

ACLJun, 2023

字符级信息是否总是改善基于 DRS 的语义分析？

Does Character-level Information Always Improve DRS-based Semantic Parsing?

Tomoya Kurosawa, Hitomi Yanaka

TL;DR研究探讨了采用字符级表示对神经模型性能的影响，通过对英语、德语、荷兰语和意大利语数据集的实验结果发现，字符级信息的引入并不能提高英语和德语语言的性能，但字符级信息可以提高荷兰语和意大利语的性能。

Abstract

Even in the era of massive language models, it has been suggested that character-level representations improve the performance of neural models. The state-of-the-art neural semantic parser for →

character-level representations neural semantic parser discourse representation structures f1-scores performance improvements

发现论文，激发创造

基于字符级表示的语义解析在 BERT 时代仍然有效

本论文提出，在序列到序列模型中，将字符级别和上下文语言模型表示相结合以提高 Discourse Representation Structure 解析的性能，并通过基于语义标签的新方法分析表明，字符级别表示改进了在选定语义现象的全部性能。

Nov, 2020

探索用于解析话语表示结构的神经方法

提出了一种基于 Neural 的序列到序列的语义解析器，它能够高准确率地产生英语句子的 DRSs，并通过引入 De Bruijn 索引消除变量名以提高解析器性能，以及加入银标注数据来进一步提高性能。

Oct, 2018

基于字符级别翻译的神经语义解析：对抽象意义表示的实验

我们使用字符级翻译的方法对一大语料库中注释有抽象意义表示的句子进行神经语义解析的评估。通过一些简单的预处理和后处理，我们使用序列到序列模型得到了一个基线准确率为 53.1。研究了五种不同的方法来改善这个基线结果，结合这五种技术的结果使获得了一项 AMR 解析的最新进展状态的成果，F 分数为 71.0。

May, 2017

字符级别模型对形态学的学习如何？以依存解析为例

对于具备丰富形态的语言，采用神经模型进行解析时，在字符级别建模具有优势，因为字符级别模型可以学习到形态学特征。通过在 12 种形态学类型不同的语言上进行实验，我们发现字符级别模型在某些情况下无法准确区分单词，特别是在面对形态学变体方面。然后，我们证明了明确定义形态学格的显式建模可以改善我们的最佳模型，表明字符级别模型可以从定向的显式形态学建模中获益。

Aug, 2018

学习跨语言分布式逻辑表示以进行语义解析

本文探讨了如何通过在不同语言中打标注的数据来学习语义解析器的分布式逻辑形式表示，以提高特定语言下单语义解析器的性能，并在标准的多语言 GeoQuery 数据集上得到了改进的结果。

Jun, 2018

基于字级别和形态学的语义角色标注模型对比研究

本文分析了使用字符、单词和形态水平信息的 SRL 模型和字符级模型的性能，研究表明字符级模型比单词和形态更适合处理未知数据并具有高层次的语义分析能力。

May, 2018

基于字符识别的神经语言模型

本研究描述了一种仅依赖字符级输入的简单神经语言模型，该模型利用卷积神经网络和字符级公路网络作为输入，并将结果给予一种长短时记忆递归神经网络语言模型作为输出，该模型可以用较少的参数占据现有最先进的地位。此外，该模型表现出色的证明了许多语言所需的字符输入已经足够进行语言建模，且可以从字符组成的部分编码的单词表示中得到语义和字形信息。

Aug, 2015

令牌知道它们的字符以及如何知道它们？

该研究探讨了在使用基于子词分割的预训练语言模型（PLMs）中，字符级信息被编码的机制以及这些模型如何获得英语语言字符信息，结论表明这些模型可以很好地编码字符级信息并通过一系列实验证明这些结果是普遍适用的，并归纳了多种现象对于知识获取的作用，其中自然变化是其中之一

Jun, 2022

使用字符感知神经网络进行词级别预测：它们是否发现语言规则？

本文研究字符级别模式识别神经网络所学习的规律以及相对于手动标注的词语分割的重叠性，并使用卷积神经网络和双向长短期记忆网络对三种不同的语言进行形态标记任务的评估和比较，证明这些模型可以隐式地发现可理解的语言规则。

Aug, 2018

MACT: 跨语言模型无关的话语结构解析训练

通过引入跨语言训练策略，深入分析和改进基于 Discourse Representation Structure（DRS）的语义表示分析模型，在英语、德语、意大利语和荷兰语的标准基准测试中取得了最先进的结果，并为未来的 DRS 分析研究提供了深入的见解。

Jun, 2024