通过概念化解释嵌入空间
本研究提出一种基于向量空间嵌入的方法,通过 Wikipedia 学习实体的嵌入并将其限制在某些较低维度子空间中,以解决概念空间表示建模自动化的局限性,实验结果表明这些子空间能够作为近似的概念空间表示,其重要特征可以被建模为方向,而自然属性则往往对应于凸区域。
Feb, 2016
利用大型语言模型将嵌入向量转化为可理解的叙述,解决了嵌入向量难于解释和使用的问题,增强了概念激活向量、通信新的嵌入实体和解码推荐系统用户偏好等任务的能力。
Oct, 2023
通过集成特征嵌入和概念解释到神经网络中进行统一的双重任务学习,本论文实现了将嵌入与语义概念关联,作为视频内容解释的新方法,并在 TRECVid 基准数据集上证明了搜索结果的显著提升。
Feb, 2024
提供了一个框架,允许用户在保持模型无关性的同时,将其领域知识的语义纳入主题模型的完善中。使用交互式视觉分析工作区支持用户完成语义空间的理解、潜在冲突和问题区域的识别以及基于对概念理解的重新调整,从而直接影响主题建模。通过操作与推荐交互相结合,目标完善旨在最小化高效的人机协同交互迭代过程所需的反馈次数,两项用户研究证实了该方法提高了主题模型质量。
Aug, 2019
本文提出和研究了一个新问题,即通过在已经训练好的无监督节点表示嵌入中找到嵌入的人类可解释子空间来解释节点嵌入。我们使用一个人类可理解的概念组成的分类知识库作为指南,在从维基百科中导出的实体图上学习的节点嵌入中识别子空间。我们提出了一种方法,通过给定一个概念,找到一个线性变换到子空间,以保留概念的结构。我们的初步实验表明,我们在找到精细概念方面获得了较低的误差。
Oct, 2019
本文提出利用概念归纳进行嵌入式学习的新方法,通过对高度并行的语料库进行测试,学习了 1259 种不同语言的语义表示,并在跨语言单词相似性和情感分析上进行了广泛实验评估,表明基于概念的多语言嵌入学习表现优于以往的方法。
Jan, 2018
该研究提出了一种统计方法来揭示密集词嵌入中的潜在语义结构,并引入了一个新的数据集(SEMCAT),其中包含超过 6500 个在 110 个类别下语义分组的单词。研究还提出了一种量化词嵌入可解释性的方法,这是一种实用的替代方法,不需要人为干预。
Nov, 2017
此研究综述了分布式语义表示的理论背景,介绍了从单词级别向更精细的词义级别转化的方法,并提供了对两种主要分支进行的广泛技术概述;最终,对其重要方面进行了分析与评估。
May, 2018
本文介绍一种利用神经嵌入模型生成连续概念向量并以此聚合生成完全连续性 Bag of Concepts 表示方法的技术,用以解决目前 Bag of Concepts 表示方法低概念重合度所导致的相似度分数偏低问题,并在实验中展示了在实体语义关联度、概念分类和无数据文件分类等领域上相对于其他模型的卓越性能。
Feb, 2017