银行业的词嵌入
本文探讨了使用不同的资源如临床笔记、生物医学出版物、维基百科和新闻训练的词嵌入,经过定性和定量评估后发现,基于临床笔记和生物医学出版物训练的词嵌入能更好地捕捉医学术语的语义,更接近于专家的判断,但是,无法为所有下游生物医学 NLP 任务提供一致的全局排名,只能将它们作为额外特征来提高大多数下游任务的结果。
Feb, 2018
本文通过对现有单词嵌入方法的特点和分类任务的分析,将单词嵌入方法划分为传统方法和基于神经网络的方法,揭示基于神经网络的单词表示方法相比于传统方法更能捕捉语言的语义和句法规律。实验验证了不同方法的性能差异。
Mar, 2023
本文探讨了基于词嵌入的体系结构在预测自然语言句子中两个财务实体之间的关联角色方面的应用,使用 skip-gram word2vec 体系结构训练词嵌入,并用机器学习分类器进行测试数据上的上下文角色相关性预测。
Apr, 2017
本研究旨在研究新的语言表示方法(如 ELMo,BERT)在医疗概念提取方面的应用,比较这些方法与传统词嵌入方法(word2vec,GloVe,fastText)的性能表现,并探讨将这些表示方法应用于医疗任务的可能性。研究结果表明,基于大型医学语料库的上下文嵌入方法表现出色,优于现有所有方法。此外,与传统词表示相比,上下文嵌入方法还包含有价值的语义信息。
Feb, 2019
本文探讨使用无监督学习的方法,通过单词嵌入在词向量空间内学习语义相似性,以实现对文本分类任务的性能优化。研究发现,使用领域特定的词嵌入可以提高分类性能。
May, 2017
本文介绍了基于 37,604 篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中,我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现,即使词汇表的大小相对较小,所创建的特定领域模型覆盖了社会科学概念的大部分,与更通用的模型相比,邻域更加多样化。在所有关系类型中,我们发现更广泛的语义关系覆盖范围。
Feb, 2023
本文针对词嵌入在自然语言处理中的应用,通过对 Word2vec、GloVe 等模型进行剖析,提出了一种通用形式,揭示出制作词嵌入所需的共同条件,并强调理论研究对未来模型开发的指导作用。
Nov, 2020
利用自然语言处理和 BioConceptVec 嵌入,预测药物和靶基因的关系,通过生物途径的分类改善性能,并通过历史关系的向量预测未知的未来关系。
Jun, 2024