有条件的词汇定义生成器

ACLJun, 2018

Conditional Generators of Words Definitions

Artyom Gadetsky, Ilya Yakubovskiy, Dmitry Vetrov

TL;DR本文探讨了最近引入的定义建模技术，在模塑字典定义的基础上评估不同分布向量表示的词语，分析了该模型中的词语歧义性问题，并提出了一个潜变量建模和软注意机制的解决方案，我们对该模型进行了定量和定性评估和分析，结果表明考虑到歧义性和多义性会提高性能。

Abstract

We explore recently introduced definition modeling technique that provided the tool for evaluation of different distributed vector representations of words through modeling dictionary definitions of words. In thi

definition modeling distributed vector representations word ambiguities latent variable modeling soft attention mechanisms

发现论文，激发创造

定义建模：学习在自然语言中定义词嵌入

本文研究如何利用分布式表示生成单词的字典定义，介绍了几种基于 RNN 的定义模型，探讨了字母级别卷积层对词级嵌入的补充，最终通过错误分析揭示了模型的缺陷。

Dec, 2016

定义建模：建立定义。使用少量或没有语义生成定义

本文研究任务是生成定义，目的是评估单词嵌入的语义质量，本文证明这个任务与语义相关性较小，并且依赖于头词和语境中出现的单词之间的形式相似性，从而对用此任务来评估单词嵌入的有效性提出质疑。

Jun, 2023

VCDM: 利用变分双编码和深度上下文化单词表示来改进定义建模

本研究提出了一种生成模型来处理定义建模任务，并使用变分推断进行估计，并利用上下文化的词嵌入来提高性能，其在四个基准测试中均取得了最先进的表现。

Oct, 2020

用于数据高效文本分类的潜变量生成模型

通过向生成式文本分类器引入离散潜变量，并探究几种图模型配置，我们提高了它的性能，尤其在小数据集下，同时分析了模型的可解释性。

Oct, 2019

生成词义表示的简单高效方法

本文介绍了一种简单的模型，它可以代表多义词的不同含义，有效地区分单词的语义，并保证计算效率。

Dec, 2014

在张量回归模型中解决语义的词汇歧义

该论文提供了一种改进基于张量合成的分布式语义模型的方法，通过在组合之前增加显式消歧步骤。我们使用线性回归训练的强大模型，展示了与以往简单模型相比更先进的先前消歧方法，并表明该方法的有效性与模型无关。

Aug, 2014

意思的不同层次：通过上下文化语言模型揭示模糊词表示的几何形态

我们的研究使用最新的上下文语言模型对词汇歧义的心理学理解进行了一系列模拟，发现它们捕捉了单义词、同音异义词和多义词之间的微妙有意义的区别，为现代心理学理解词汇歧义提供了量化支持，并提出了理解上下文信息如何跨不同时间尺度塑造词汇意义的新挑战。

Apr, 2023

利用词嵌入解决词义模糊问题

将 DBSCAN 聚类应用到潜在空间可以识别模糊词并评估其模糊程度，从而解决自然语言中的歧义问题。

Jul, 2023

精细对比学习用于定义生成

本文提出一种新型对比学习方法，以有效地学习和表达所考虑词语的语义组成部分，并使模型在进行定义生成任务时，能够生成更具体、高质量的定义，实验证明该方法优于现有模型。

Oct, 2022

大型语言模型中的词汇定义

我们通过对比传统词典的定义和 ChatGPT 的生成定义来探索传统词典与计算机生成定义之间的相似程度，结果显示：与模型生成的定义相比，不同传统词典的定义在表面形式上更相似；ChatGPT 的定义非常准确，与传统词典相媲美；而 ChatGPT 生成的嵌入定义在低频词上的准确性也比 GloVe 和 FastText 词嵌入模型要好。

Nov, 2023