副词,出人意料
在文本数据增广领域,为了节约成本,基于规则的方法被广泛采用。然而,传统的基于规则的方法可能会丢失给定文本的原始语义。我们提出了一种新颖的文本数据增广策略,通过简单地删除在句子中起辅助作用的副词来避免这种现象。我们的全面实验证明了我们提出的方法的高效性和有效性,不仅适用于单一文本分类,还适用于需要语义保持的自然语言推理。我们公开发布了我们的源代码以供重现。
Mar, 2024
本文系统研究了 scalar adverbs 这一类词在 BERT,RoBERTa,GPT-2 和 GPT-3 预训练语言模型中的表现,并发现虽然这些模型对逻辑含义的理解有一定的表现,但与人类的表现还有很大差距。
May, 2023
通过研究基于人工神经网络编码的句子语境和词汇形态,本研究构建了五个数据集并测试了模型的可靠性,结果显示该方法对于某些动词变化是可行的,但对于其他动词变化则难以提取细粒度的字面信息。
Nov, 2018
通过研究表明,许多常见的副词短语一般被认为是表示话语结构内句法连接单元之间的话语关系,实际上是指代地为组成意义做出贡献,只是间接依赖于话语结构。这为组合语义提供了一个更简单的话语结构,并揭示了副词连词所传达的关系含义与话语结构相关的多种交互方式。最后,本文勾画了一种用于话语的词汇化语法,其通过组成规则、代词解析和推理实现话语的解释。
Sep, 2001
该论文评述了语义变化计算在计算语言学领域中的发展现状,提出了一个框架,总结了该领域的五个关键组成部分:历时语料库、历时词义表征、变化建模、评估数据和数据可视化,并指出了该领域存在的核心问题。
Jan, 2018
分析了两个自然语言推理数据集的语言特征,发现机器学习模型难以理解介词和动词语义重要性,不能理解反义词和同音词,不能理解不完整的句子和罕见单词短语,因此需要在训练过程中尽可能利用更多外部知识。
Oct, 2022
该论文重新考虑了一个广泛覆盖的注释方案,认为介词的词汇贡献不等同于介词所介导的角色 / 关系,并提出了一个用于表示场景角色和介词词汇功能的框架,从而实现了构建分析。
Mar, 2017
在视频的细粒度理解中,我们提出了一个视频 - 副词检索的框架,通过在联合嵌入空间中将视频嵌入与其匹配的组成副词 - 动作文本嵌入进行对齐。我们的方法在视频 - 副词检索的五个最新基准上实现了最新的性能,同时引入了基于 MSR-VTT Adverbs 和 ActivityNet Adverbs 数据集子集的未见副词 - 动作组合的视频 - 副词检索基准,我们的框架在将副词从视频中检索出未见的副词 - 动作组合的泛化任务上优于所有先前的工作。
Sep, 2023
本文研究了不同上下文环境下,有些动词引起的语义框架不同,以及如何利用 Contextualized word representations 识别这些不同的语义框架,同时探索哪些类型的表示适合用于语义框架的归纳。通过比较七种不同的 Contextualized word representations,特别是 BERT 和其变体,在 FrameNet 和 PropBank 等英语 Frame-semantic 资源方面进行了实验,表明,某些 Contextualized word representations 对于语义框架的归纳具有相当的信息量。此外,本文还考察了动词的上下文表示估算其所引起的语义框架数的程度。
May, 2021