TREC-COVID 旨在建立一项新的测试集,以捕捉生物医学研究者在疫情期间使用科学文献的信息需求,其中关键特征是加速的变化率和不断爆炸式的科学文献。
May, 2020
本研究通过使用 Transformer 神经网络,在 CORD-19 数据集上解决了 COVID-19 文献检索和问答的挑战,并展示了其在一些实例上的有效性。
Nov, 2022
本文介绍了 CO-Search,这是一款检索 - 排序语义搜索引擎,设计用于处理 COVID-19 相关文献,包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等,以高效地帮助寻找科学答案,并在多项指标上获得了最佳表现。
Jun, 2020
使用 NLP 技术,如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型,结合余弦相似度算法,在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。
May, 2022
利用 NLP 技术(如命名实体识别和聚类算法)对 PubMed 数据库中的 LitCovid 文献进行分析,从中筛选出与 COVID-19 相关的生物实体、症状、并发症等,帮助人们快速了解 COVID-19 相关文献的主题和研究进展。
Aug, 2020
提出了一种零样本排名算法,它适应于 COVID-19 相关的科学文献,它主要使用了一种预先训练在科学文本上的神经再排序模型 (SciBERT),该方法在 TREC COVID Round 1 排行榜中排名最高且表现优异,在不依赖 TREC-COVID 数据的情况下,该方法的表现优于依赖这些数据的模型,是一种强大的全球危机搜索基线。
Oct, 2020
本研究通过多种数据源建立了多个机器学习模型对当前 COVID-19 研究场景进行了表征,包括识别潜在主题、分析出版物相似性和情感。结果表明 PubMed 和 ArXiv 中的研究类型存在显著区别,前者在 COVID-19 相关问题的多样性方面具有更大的多样性,后者则更关注预测 / 诊断 COVID-19 的智能系统 / 工具。研究团队对高危人群和并发症患者的特别关注也得到了证实。
Jul, 2020
本研究的主要目标是开发一种工具,将信息检索和提取技术应用于 COVID-19 开放研究数据集(CORD-19),为研究人员提供更好的 COVID-19 相关论文搜索工具,帮助他们找到参考论文并突出显示文本中的相关实体。
Jan, 2024
本文介绍了一种新颖的从全文中提取和搜索科学挑战和方向的任务,以促进快速知识发现。我们构建并发布了一个专家注释的语料库,并使用我们的数据训练模型来识别 COVID-19 疫情相关的生物医学跨学科工作中的挑战和方向,从而构建了一个专用搜索引擎。我们的实验表明,我们的系统在协助知识发现方面优于流行的科学搜索引擎,并且我们的模型可以泛化到更广泛的生物医学领域和 AI 论文。
Aug, 2021
本文提供了一种结合大型数据建模、信息制图和趋势分析的新型自动化主题可视化方法,用于快速发现 COVID-19 疫情下的主题和研究资源,结果显示了有关社交隔离、医疗话题、病毒在不同地区的演变轨迹等信息,同时也表明了迫切需要快速自动化地进行大规模数据的搜索和浏览。