COVID-19 知识图谱:加速科学文献信息检索和发现
使用知识图谱、机器学习和深度学习等工具,分析 COVID-19 相关的 PubMed 数据集和 CORD-19 数据集,发现专家、生物实体,预测相关疾病、药物候选者、基因突变和相关化合物,从而帮助生物医学研究人员应对 COVID-19 大流行。
Jul, 2020
为了应对 COVID-19,我们开发了一个全新的综合性知识发现框架 COVID-KG,从科学文献中提取了细粒度的多媒体知识元素,并利用构建的多媒体知识图谱用于问答和报告生成,以药物再利用为案例研究。该框架还提供了详细的上下文句子,子图和知识子图作为证据。
Jul, 2020
本文介绍了 CO-Search,这是一款检索 - 排序语义搜索引擎,设计用于处理 COVID-19 相关文献,包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等,以高效地帮助寻找科学答案,并在多项指标上获得了最佳表现。
Jun, 2020
使用生物知识图谱进行药物再利用,通过预测候选药物的有效性和药物与与疾病相关的蛋白质结合的可能性,通过嵌入模型和神经网络进行学习并实现了不同的模型来获取节点嵌入。在 MR、MRR 和 Hits@3 方面,RESCAL 在测试数据集上表现最佳。
Dec, 2022
使用 NLP 技术,如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型,结合余弦相似度算法,在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。
May, 2022
本文提出 Covidia,COVID-19 研究的跨学科学术知识图谱,并设计了基于对比学习的学科分类和实体提取以及关系分类和本体管理的框架。基于 Covidia,我们还建立了知识发现基准,以发现 COVID-19 研究团体和预测潜在关联。
Apr, 2023
本文提供了一种结合大型数据建模、信息制图和趋势分析的新型自动化主题可视化方法,用于快速发现 COVID-19 疫情下的主题和研究资源,结果显示了有关社交隔离、医疗话题、病毒在不同地区的演变轨迹等信息,同时也表明了迫切需要快速自动化地进行大规模数据的搜索和浏览。
May, 2020
我们正在开发语义可视化技术以增强探索和发现复杂关系的大型数据集的能力,包括使用 NLP 从原始数据中提取命名实体、关系和知识图,对所有相关实体和关系进行索引并创建各种可视化形式的表示,并使用参数缩减操作创建 “关系容器” 或功能性实体,以便通过多种方式可视化多个关系,部分路径和多维探索,从而发现复杂数据中的新推断。我们已将此应用于对最近发布的 CORD-19 数据集的分析。
Jul, 2020
我们提出了一个新颖的系统,从生物医学语料库中自动提取和生成信息丰富、描述性的句子,促进相关知识的高效检索。与以往的搜索引擎或探索系统不同,我们的系统将描述性句子组织为关系图,使研究人员能够探索密切相关的生物医学实体(例如,化学品治疗的疾病)或间接相连的实体(例如,治疗疾病的潜在药物)。我们的系统还使用 ChatGPT 和经过微调的关系综合模型从检索到的信息中生成简明可靠的描述性句子,减少了对大量人工阅读的需求。通过我们的系统,研究人员可以轻松获得高层次知识和详细参考资料,并交互式地定位所需的信息。我们重点介绍了我们的系统在 COVID-19 研究中的应用,说明了它在药物再利用和文献整理等领域的实用性。
Oct, 2023
KG-based search engine architecture for finding doctors and locations in healthcare domain, with significantly higher coverage for complex queries without degrading quality.
Oct, 2023