- 通过语境化语言模型诱导概念:从词义到更多
通过本文,我们引入了概念归纳这个非监督任务,从数据中学习一组定义概念的词语软聚类,该任务概括了词义归纳的任务。我们提出了一种双层方法来进行概念归纳,充分利用了本地词元为中心和全局跨词库视角来引导概念的生成。我们在 SemCor 的注释数据上 - 跨语境上下文短语检索
通过利用短语提供的细粒度信息,我们提出了密集检索的新任务形式,即跨语言上下文短语检索,通过使用上下文信息解决多义词问题,实验结果展示了我们方法的有效性。
- 词汇歧义检测与词义消歧综述
该研究论文探讨自然语言处理领域中关于理解和解决语言中的歧义的技术,强调了多义性和同音异义性等语言现象的复杂性,以及它们对计算模型的影响。论文详细介绍了从深度学习技术到利用词汇资源和知识图谱(如 WordNet)的各种方法,重点研究了词义消歧 - 解决命名实体中的正交多义性
通过基于规则同义词的光点物体来解决 proper names 产生的歧义问题,本文引入了一种结合词义消岐模型,用于对中文词网(CWN)和光点物体作为 proper names 进行歧义消岐。该模型利用了基于词网的模型结构的灵活性,从而充分发 - 美洲土著语的共兰词中的亲密性和抽象性模式
本文将考察语言学、语言学、多义性、具体性和抽象性这五个关键词在美洲土著语中的联系和共发现现象。
- 公司背景下设计思维与创意视角的定量动态
本研究使用构建的动态语义网络的新方法分析了设计思维研讨会上的设计讨论,并对该过程中公司代表和公司规模进行了研究,结果表明,与单一公司设计中心的研讨会相比,来自四家公司的研讨会中的设计管理人员更专注于更具体的设计问题,其设计思维具有更少的歧意 - 定义建模:建立定义。使用少量或没有语义生成定义
本文研究任务是生成定义,目的是评估单词嵌入的语义质量,本文证明这个任务与语义相关性较小,并且依赖于头词和语境中出现的单词之间的形式相似性,从而对用此任务来评估单词嵌入的有效性提出质疑。
- 语言和视觉模型几何形态的融合含义
通过对三种不同的预训练语言模型和三种计算机视觉模型进行实证研究,本文发现预训练语言模型具有与计算机视觉模型部分同构的表示收敛能力,其中分散性和多义性对语言和视觉空间的对齐性产生影响 。
- EMNLPSensePOLAR:针对预训练上下文词嵌入的词义感知可解释性
该研究提出 SensePOLAR, 一种扩展的 POLAR 框架,可以为预训练的上下文词嵌入提供词义感知的可解释性,以达到与原来的上下文词嵌入相同的性能表现。
- 英语 WordNet 的同音词信息
本文重新访问了填补 WordNet 中同音异义词及多义词间差异的问题,并且利用语言模型对此进行了合成标注。
- 用于计算语义相似度的分类和神经嵌入方法的评估
本论文探讨了计算语义相似度的不同方法,比较了分类和分布式语义相似度的不同特点,提出了类别相似度建模的三种加权因素,发现在不同词频、多义性和相似度强度范围内存在语义相似度计算巨大差距。
- 上下文中的迷失?关于上下文化词向量的意义差异
揭示了上下文化单词嵌入的一些特征,包括上下文中单词意思的变化程度,单词在不同上下文中的一致性,以及单词位置偏差的影响,并提出一种减轻这种偏差的简单方法。
- 复合词构成成分的意义消岐
本文介绍了一种新颖的 Word Sense Disambiguation 方法,基于 set expansion 的思想,旨在解决复合词中多义词汇的歧义问题,实验表明该方法具有一定的成功率,但对复合词出现频率敏感。
- EMNLP语境化语言模型中的词汇歧义模式
本文研究了语境化语言模型的多义词辨别能力。作者提出了一个人工注释的数据集,用于评估多义词词义的相似性,发现多义词的词义相似性介于相同和同音异义之间,并呈现出一定的词义变化规律性。BERT Large 在相似性等级方面表现最佳,但无法一致地复 - EMNLP无监督上下文化文档表示
该研究提出一种简单而有效的无监督表示方法 SCDV+BERT (ctxd),通过结合上下文化的 BERT 方法和 SCDV 软聚类方法来处理单义和上下文特性的词语。研究表明,在多项分类数据集和概念匹配和句子相似性等任务中,此嵌入方法的性能优 - ACL多源神经主题建模在多视图嵌入空间中
本文提出了一种使用多视图嵌入空间的神经主题建模框架,通过联合多种来源的预训练主题嵌入和预训练词嵌入来提高主题质量并更好地处理一词多义。文章通过从新闻和医疗领域的不同文本集合中进行实验,评估了主题和文档表示的质量。
- COLING上下文诱导的词嵌入编码人类词义知识的方面
本文探讨了自然语言处理中的一项工作,基于 BERT 嵌入空间来评估英语单词的多义和同音词意义之间的相关性。发现使用 BERT 嵌入模型能够在意义表示上更加清晰地捕捉多义性和同音词意的潜在结构,具有潜在的应用价值。
- 使用上下文化的单词表示聚类进行主题建模
通过聚类基于 token 的上下文化词表示,可以更自然地捕捉多义性,并用作组织文档的方法,此方法与 LDA 主题模型效果相近且表现出更高的主题质量,尤其是对于 BERT 和 GPT-2 输出层训练的 token 聚类。
- 基于多分辨率上下文嵌入网络的无监督词汇多义数量化
本文提出了一种基于上下文嵌入空间中的简单几何形式的新颖方法来评估多义性,该方法是完全无监督和纯数据驱动的,能够较好地反映来自 WordNet、OntoNotes、Oxford 和维基百科等 6 种不同标准度量方法的排名,并能对人工排名之间的 - 分布语义学与语言学理论
该综述文章阐述了分布语义学在理论语言学领域的影响有限,但其成功地捕捉了自然语言诸多意义方面,并回顾了该领域在语义变化、一词多义及组合,以及语法 - 语义接口等领域的研究成果,旨在在理论和计算语言学之间进行更大规模的交叉授粉,以推进我们集体的