构建流行病信息检索测试集合 ——TREC-COVID

SIGIRMay, 2020

构建流行病信息检索测试集合 ——TREC-COVID

TREC-COVID: Constructing a Pandemic Information Retrieval Test Collection

Ellen Voorhees, Tasmeer Alam, Steven Bedrick, Dina Demner-Fushman, William R Hersh...

TL;DRTREC-COVID 旨在建立一项新的测试集，以捕捉生物医学研究者在疫情期间使用科学文献的信息需求，其中关键特征是加速的变化率和不断爆炸式的科学文献。

Abstract

trec-covid is a community evaluation designed to build a test collection that captures the information needs of biomedical researchers using the scientific literature during a pandemic. One of the key characteristics of

trec-covid biomedical research scientific literature pandemic search covid-19

发现论文，激发创造

搜索 COVID-19 问题的科学文献

探讨如何为新疾病的大流行提供可靠的信息支持，实现新的信息检索，采用不同的排名算法，并提出了神经检索方法，并在 TREC COVID 搜索中证明其有效性。

Jul, 2020

CO-Search：基于语义搜索、问答和摘要生成的 COVID-19 信息检索

本文介绍了 CO-Search，这是一款检索 - 排序语义搜索引擎，设计用于处理 COVID-19 相关文献，包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等，以高效地帮助寻找科学答案，并在多项指标上获得了最佳表现。

Jun, 2020

COV19IR：COVID-19 领域文献信息检索

本研究通过使用 Transformer 神经网络，在 CORD-19 数据集上解决了 COVID-19 文献检索和问答的挑战，并展示了其在一些实例上的有效性。

Nov, 2022

利用文本挖掘技术进行 COVID-19 文献挖掘和检索

使用 NLP 技术，如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型，结合余弦相似度算法，在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。

May, 2022

RRF102：用 100 多次运行集合应对 TREC-COVID 挑战

本文报道我们参加 TREC-COVID 挑战赛的结果。我们提出了一种简单而有效的加权层次排名融合方法，将 (a) 词汇和语义召回系统、(b) 预训练和微调的 BERT-Rankers、和 (c) 相关反馈运行合成。我们的消融研究证明了每个系统对整体合奏的贡献。提交的集合运行在 TREC-COVID 挑战赛的第 4 和 5 轮中取得了最先进的性能。

Oct, 2020

通过文献分析导航 COVID-19 研究领域：鸟瞰全局

利用 NLP 技术（如命名实体识别和聚类算法）对 PubMed 数据库中的 LitCovid 文献进行分析，从中筛选出与 COVID-19 相关的生物实体、症状、并发症等，帮助人们快速了解 COVID-19 相关文献的主题和研究进展。

Aug, 2020

ReCOVery：COVID-19 新闻可信度研究的多模态存储库

本研究研发了一个名为 ReCOVery 的信息库，收集并提供新冠疫情相关的新闻，具体包括文本、图片、时间和网络信息等。为了提高数据集的规模，同时也更加保证标签的准确度，本文通过获取新闻媒体的可信度作为新闻的标签。我们对其中包含的数据进行各种实验，得到了数据的统计数据和分布，训练出了预测新闻真实性的基线性能，以便与将来的方法进行比较。

Jun, 2020

探索 COVID-19 大流行期间研究主题的演变

基于 CORD-19 文本摘要的 CORToViz 可视化工具，利用最新科技，通过聚类文章并提取主题的方法，提供快速可视化主题内容和趋势的交互式仪表盘，适用于任何文本文档语料库的数据准备和结果可视化。

Oct, 2023

COVID-19 相关论文的信息检索和提取工具

本研究的主要目标是开发一种工具，将信息检索和提取技术应用于 COVID-19 开放研究数据集（CORD-19），为研究人员提供更好的 COVID-19 相关论文搜索工具，帮助他们找到参考论文并突出显示文本中的相关实体。

Jan, 2024

利用机器学习和自然语言处理方法来研究 COVID-19 研究的时间演变

本研究通过多种数据源建立了多个机器学习模型对当前 COVID-19 研究场景进行了表征，包括识别潜在主题、分析出版物相似性和情感。结果表明 PubMed 和 ArXiv 中的研究类型存在显著区别，前者在 COVID-19 相关问题的多样性方面具有更大的多样性，后者则更关注预测 / 诊断 COVID-19 的智能系统 / 工具。研究团队对高危人群和并发症患者的特别关注也得到了证实。

Jul, 2020