类比、同义词、反义词和关联词的统一方法

Aug, 2008

类比、同义词、反义词和关联词的统一方法

A Uniform Approach to Analogies, Synonyms, Antonyms, and Associations

PDF

Peter D. Turney

TL;DR本文提出基于语料库的机器学习算法作为识别类比、近义词、反义词和联系词的方法，并且验证了其有效性

Abstract

Recognizing analogies, synonyms, antonyms, and associations appe

analogies synonyms antonyms associations nlp algorithms

发现论文，激发创造

基于语料库的类比和语义关系学习

论文提出” 基于向量空间模型（VSM）的无标注文本学习算法 “，应用于中学生常见 SAT 考试的语义类比题及名词修饰语语义关系分类中，取得了 47% 和 43.2% 的正确率，性能达到当时最高水平。

Aug, 2005

超越词汇的分布式语义学：类比和释义的监督学习

本篇论文介绍了一种将分布式语义学从单个单词扩展到词对、短语和句子等的方法，通过使用组件词中的成对相似性来比较两个元组，从而实现关系相似性（类比）和组成相似性（释义）之间的转换，并通过监督学习生成组合函数。在衡量单词对之间的关系相似性（SAT 类比和 SemEval 2012 任务 2）和名词修饰短语和单个词之间的组成相似性方面取得了最优结果。

Oct, 2013

基于模式的神经网络中的反义词和同义词判别

该研究提出一种名为 AntSynNET 的神经网络模型，利用词汇 - 句法模式和合成语法树来区分词汇关系，实验结果表明 AntSynNET 相对先前的基于模式的方法表现更好。

Jan, 2017

生活如马戏团，我们是小丑：自动寻找情境和进程之间的类比

本研究通过探索一种更具有现实性且具有挑战性的方法，基于关系相似性来找到不同域之间的映射，使用自动提取文本中实体及其关系并进行解释性的可扩展性算法，从大量的自然语言过程文本数据集中提取类比，并证明该算法对于文本的释义具有鲁棒性。

Oct, 2022

解决形态学类比问题：从检索到生成

本文提出了一个深度学习框架来解决类比检测和解决两个关键问题，并在 morphological analogical proportions 数据集上进行了测试表明优于符号方法。文章总结了之前的研究，并结合了 ANNe 和 AE 嵌入模型。最终得出该模型在绝大多数情况下都优于其他方法，并提供了使用 DL 来处理类比问题的一般指南。

Mar, 2023

语义关系的相似性

本文介绍了一种测量关联相似性的方法 —— 潜在关联分析（LRA），该方法在信息提取、词义消岐和信息检索等领域具有潜在应用价值，并且与人类平均水平相当地达到了 374 个类比问题的 56% 的得分，同时，在语义关系分类的问题上，LRA 较 VSM 也取得了相似的增益。

Aug, 2006

ANALOGICAL - 大语言模型长文本类比的新基准

提出了一个新的基准测试，名为 ANALOGICAL，在长文本的类比上对大型语言模型（LLMs）进行内在评估。在使用 13 个数据集和 3 种不同距离度量进行评估的过程中，发现当上升类比分类学时，LLMs 越来越难以识别类比。

May, 2023

自然语言和本体分析的语义相似性

本书主要介绍语义相似度估计及其它语义度量学科的两种最先进的方法：自然语言处理技术和语义模型以及基于语义网络、词库或本体论的计算机可读的知识形式。它的目的是为初学者和研究人员提供更好地理解语义相似度估计和更一般的语义度量。

Apr, 2017

为何需要神经符号人工智能模型来建模实用类比？

使用熟悉的领域进行类比推理是智能的标志。本文研究大型语言模型在处理逐渐复杂的结构化文本中的类比时的表现，并讨论了四个不同复杂程度的类比：词汇类比、句法类比、语义类比和语用类比。为了解决这个问题，我们提出了结合统计和符号人工智能的神经符号 AI 技术的必要性，以强调和增强相关内容，并提供抽象和指导映射过程的无结构文本表示。我们的知识驱动方法保持了大型语言模型的高效性，同时保留了解释类比的能力，适用于教学应用。

Aug, 2023

通过语境化语言模型诱导概念：从词义到更多

通过本文，我们引入了概念归纳这个非监督任务，从数据中学习一组定义概念的词语软聚类，该任务概括了词义归纳的任务。我们提出了一种双层方法来进行概念归纳，充分利用了本地词元为中心和全局跨词库视角来引导概念的生成。我们在 SemCor 的注释数据上评估所得到的聚类，并获得了良好的性能（BCubed F1 大于 0.60）。我们发现在我们的设置中，本地和全局层次相互有益于概念和词义的生成。最后，我们创建了表示我们引入的概念的静态嵌入，并在上下文任务中使用它们，取得了与现有技术相媲美的性能。

Jun, 2024