本文研究如何利用分布式表示生成单词的字典定义,介绍了几种基于 RNN 的定义模型,探讨了字母级别卷积层对词级嵌入的补充,最终通过错误分析揭示了模型的缺陷。
Dec, 2016
本文研究任务是生成定义,目的是评估单词嵌入的语义质量,本文证明这个任务与语义相关性较小,并且依赖于头词和语境中出现的单词之间的形式相似性,从而对用此任务来评估单词嵌入的有效性提出质疑。
Jun, 2023
本研究提出了一种生成模型来处理定义建模任务,并使用变分推断进行估计,并利用上下文化的词嵌入来提高性能,其在四个基准测试中均取得了最先进的表现。
Oct, 2020
通过向生成式文本分类器引入离散潜变量,并探究几种图模型配置,我们提高了它的性能,尤其在小数据集下,同时分析了模型的可解释性。
Oct, 2019
本文介绍了一种简单的模型,它可以代表多义词的不同含义,有效地区分单词的语义,并保证计算效率。
Dec, 2014
该论文提供了一种改进基于张量合成的分布式语义模型的方法,通过在组合之前增加显式消歧步骤。我们使用线性回归训练的强大模型,展示了与以往简单模型相比更先进的先前消歧方法,并表明该方法的有效性与模型无关。
Aug, 2014
我们的研究使用最新的上下文语言模型对词汇歧义的心理学理解进行了一系列模拟,发现它们捕捉了单义词、同音异义词和多义词之间的微妙有意义的区别,为现代心理学理解词汇歧义提供了量化支持,并提出了理解上下文信息如何跨不同时间尺度塑造词汇意义的新挑战。
Apr, 2023
将 DBSCAN 聚类应用到潜在空间可以识别模糊词并评估其模糊程度,从而解决自然语言中的歧义问题。
Jul, 2023
本文提出一种新型对比学习方法,以有效地学习和表达所考虑词语的语义组成部分,并使模型在进行定义生成任务时,能够生成更具体、高质量的定义,实验证明该方法优于现有模型。
Oct, 2022
我们通过对比传统词典的定义和 ChatGPT 的生成定义来探索传统词典与计算机生成定义之间的相似程度,结果显示:与模型生成的定义相比,不同传统词典的定义在表面形式上更相似;ChatGPT 的定义非常准确,与传统词典相媲美;而 ChatGPT 生成的嵌入定义在低频词上的准确性也比 GloVe 和 FastText 词嵌入模型要好。
Nov, 2023