Onto2Vec: 生物实体及其基于本体论的注释的联合向量表示
该论文提出了一种新的方法,OPA2Vec,通过将正式本体公理和本体元数据中的注释公理结合起来,生成生物实体在本体中的向量表示,从而进行语义相似度计算。
Apr, 2018
提出了 On2Vec,它是一种新的基于翻译的图形嵌入方法,可以有效地解决本体填充问题。 On2Vec 集成了两个模型组件,可以有效地特征化本体图中的全面关系事实。 在多个知名本体图上的实验表明,On2Vec 可以预测和验证新的关系事实。
Sep, 2018
本文提出了一种基于随机游走和词嵌入的本体嵌入方法 OWL2Vec *,该方法将 OWL 本体的语义编码为结合了图结构,词汇信息和逻辑构造式的表示。通过在三个真实数据集上的实证评估,我们发现 OWL2Vec * 在类成员预测和类包含预测任务中从本体的三个不同方面受益,并且通常在我们的实验中优于现有的技术水平。
Sep, 2020
本篇研究提出了 BioConceptVec,通过利用最先进的文本挖掘工具和机器学习模型学习 PubMed 摘要中介绍的超过 400,000 个生物概念的向量表示(即嵌入),来捕捉相关概念的语义。BioConceptVec 已经在包括 9 个不同生物数据集的 2500 万实例的多个生物信息学任务中得到了全面评估,在所有任务中其性能均优于现有方法。最后,BioConceptVec 通过网站免费向研究社区和公众提供。
Dec, 2019
本文提出了一种考虑边缘语义的图表示学习模型 edge2vec,通过训练边缘类型转换矩阵和使用随机梯度下降模型,基于异构图学习节点嵌入。在生物医学领域的三个任务中,edge2vec 在考虑边缘类型的情况下明显优于其他几种现有的模型,展示了不同知识领域的应用前景。
Sep, 2018
介绍了一种新的生物序列表示和特征提取方法 BioVec,通过人工神经网络方法,将蛋白质序列表示为单个 n 维向量,可精确地识别蛋白质家族分类、蛋白质结构预测、无序蛋白质鉴定等各类生物信息学任务,表现优于现有方法。
Mar, 2015
该研究探讨了图形和关系结构的矢量表示,以及生成这些表示的方法。作者提出了两种理论方法来理解矢量嵌入的基础,并建议未来的研究方向。
Mar, 2020
本文提出了一种基于随机投影的低维嵌入方法,可以快速高效地计算不同形式的生物序列,从而避免了核方法的计算时间、内存使用和泛化性挑战。该方法的预测性能在多种真实分类任务中优于若干最先进的嵌入和核方法
Apr, 2023
本文提出一个以本体指导实体对齐的方法 OntoEA,该方法通过联合嵌入本体和知识图谱来避免虚假映射,实验证明了该方法的优越性和本体的有效性。
May, 2021
ReOnto 是一种利用神经符号知识进行关系抽取任务的新技术,通过使用图神经网络获取句子表示并利用公开可访问的本体论来确定两个实体之间的句内关系,从本体论中提取两个实体之间的关系路径。在两个公共生物医学数据集 BioRel 和 ADE 上进行的实验结果显示,我们的方法优于所有基准方法(大约提高了 3%)。
Sep, 2023