SLEDGE: 一种简单而有效的 COVID-19 科学知识搜索基线
提出了一种零样本排名算法,它适应于 COVID-19 相关的科学文献,它主要使用了一种预先训练在科学文本上的神经再排序模型 (SciBERT),该方法在 TREC COVID Round 1 排行榜中排名最高且表现优异,在不依赖 TREC-COVID 数据的情况下,该方法的表现优于依赖这些数据的模型,是一种强大的全球危机搜索基线。
Oct, 2020
本文介绍了 CO-Search,这是一款检索 - 排序语义搜索引擎,设计用于处理 COVID-19 相关文献,包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等,以高效地帮助寻找科学答案,并在多项指标上获得了最佳表现。
Jun, 2020
探讨如何为新疾病的大流行提供可靠的信息支持,实现新的信息检索,采用不同的排名算法,并提出了神经检索方法,并在 TREC COVID 搜索中证明其有效性。
Jul, 2020
本研究的主要目标是开发一种工具,将信息检索和提取技术应用于 COVID-19 开放研究数据集(CORD-19),为研究人员提供更好的 COVID-19 相关论文搜索工具,帮助他们找到参考论文并突出显示文本中的相关实体。
Jan, 2024
使用 NLP 技术,如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型,结合余弦相似度算法,在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。
May, 2022
本研究通过多种数据源建立了多个机器学习模型对当前 COVID-19 研究场景进行了表征,包括识别潜在主题、分析出版物相似性和情感。结果表明 PubMed 和 ArXiv 中的研究类型存在显著区别,前者在 COVID-19 相关问题的多样性方面具有更大的多样性,后者则更关注预测 / 诊断 COVID-19 的智能系统 / 工具。研究团队对高危人群和并发症患者的特别关注也得到了证实。
Jul, 2020
COVID-SEE 是一个基于信息探索概念的医学文献发现系统,通过多种不同的文本分析和自然语言处理方法来组织信息,并通过提供视觉概述增强搜索来帮助医学专业人员和研究人员探索文献证据,并提高相关信息的可发现性。
Aug, 2020
本研究通过使用 Transformer 神经网络,在 CORD-19 数据集上解决了 COVID-19 文献检索和问答的挑战,并展示了其在一些实例上的有效性。
Nov, 2022
提供 COVID-19 专用的神经网络搜索引擎 AWS CORD-19 Search (ACS),该引擎结合多种机器学习系统,如文档排名、问题回答和主题分类等能力,以自然语言为基础提供可靠的搜索结果。我们对该系统进行了数量和质量方面的验证,结果表明 ACS 是最优的 COVID-19 搜索平台之一。
Jul, 2020
本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现,发现在该数据集上微调过的预训练语言模型表现最佳,并探讨了其数据效率和可推广性,同时也提出了未来研究中需要解决的问题,数据和代码均在 GitHub 上可获取。
Jun, 2020