使用 NLP 技术,如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型,结合余弦相似度算法,在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。
May, 2022
本文介绍了 CO-Search,这是一款检索 - 排序语义搜索引擎,设计用于处理 COVID-19 相关文献,包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等,以高效地帮助寻找科学答案,并在多项指标上获得了最佳表现。
Jun, 2020
探讨如何为新疾病的大流行提供可靠的信息支持,实现新的信息检索,采用不同的排名算法,并提出了神经检索方法,并在 TREC COVID 搜索中证明其有效性。
Jul, 2020
本研究的主要目标是开发一种工具,将信息检索和提取技术应用于 COVID-19 开放研究数据集(CORD-19),为研究人员提供更好的 COVID-19 相关论文搜索工具,帮助他们找到参考论文并突出显示文本中的相关实体。
Jan, 2024
利用 NLP 技术(如命名实体识别和聚类算法)对 PubMed 数据库中的 LitCovid 文献进行分析,从中筛选出与 COVID-19 相关的生物实体、症状、并发症等,帮助人们快速了解 COVID-19 相关文献的主题和研究进展。
Aug, 2020
本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现,发现在该数据集上微调过的预训练语言模型表现最佳,并探讨了其数据效率和可推广性,同时也提出了未来研究中需要解决的问题,数据和代码均在 GitHub 上可获取。
为了应对 COVID-19,我们开发了一个全新的综合性知识发现框架 COVID-KG,从科学文献中提取了细粒度的多媒体知识元素,并利用构建的多媒体知识图谱用于问答和报告生成,以药物再利用为案例研究。该框架还提供了详细的上下文句子,子图和知识子图作为证据。
本文探讨了如何通过合成的问答数据来提高封闭领域检索和机器阅读理解的性能,实验结果表明将神经信息检索系统和机器阅读理解系统组合后,在 CORD-19 数据集上相比于基准开放领域问答系统,有显著的改进。
Dec, 2020
为了解决 COVID-19 疫情期间虚假信息泛滥的问题,本文利用开放域问答技术,构建了一个能够从大规模 COVID-19 科学论文中检索答案的系统,并结合有效的重新排序和多次回答技巧。实验表明,尽管数据量较小,该系统仍然可用于训练,成为用于类似领域的快速开发的模型。
Oct, 2021
本论文介绍了 covidAsk,一个基于生物医学文本挖掘和问答技术结合起来的用于实时回答问题的问答系统,并使用 COVID-19 Questions 数据集对其进行了评估。该系统被设计来帮助研究人员寻找关于新冠病毒和未来疫情的知识和信息。