构建流行病信息检索测试集合 ——TREC-COVID
探讨如何为新疾病的大流行提供可靠的信息支持,实现新的信息检索,采用不同的排名算法,并提出了神经检索方法,并在 TREC COVID 搜索中证明其有效性。
Jul, 2020
本文介绍了 CO-Search,这是一款检索 - 排序语义搜索引擎,设计用于处理 COVID-19 相关文献,包括使用 Siamese-BERT 编码器、BM25 矢量化器和多跳问答模块等,以高效地帮助寻找科学答案,并在多项指标上获得了最佳表现。
Jun, 2020
本研究通过使用 Transformer 神经网络,在 CORD-19 数据集上解决了 COVID-19 文献检索和问答的挑战,并展示了其在一些实例上的有效性。
Nov, 2022
使用 NLP 技术,如词袋、平均词向量、平均 BERT 基础模型和 Tf-Idf 加权词向量模型,结合余弦相似度算法,在 CORD-19 数据集中找出与 COVID-19 主题有关的研究文献。
May, 2022
本文报道我们参加 TREC-COVID 挑战赛的结果。我们提出了一种简单而有效的加权层次排名融合方法,将 (a) 词汇和语义召回系统、(b) 预训练和微调的 BERT-Rankers、和 (c) 相关反馈运行合成。我们的消融研究证明了每个系统对整体合奏的贡献。提交的集合运行在 TREC-COVID 挑战赛的第 4 和 5 轮中取得了最先进的性能。
Oct, 2020
利用 NLP 技术(如命名实体识别和聚类算法)对 PubMed 数据库中的 LitCovid 文献进行分析,从中筛选出与 COVID-19 相关的生物实体、症状、并发症等,帮助人们快速了解 COVID-19 相关文献的主题和研究进展。
Aug, 2020
本研究研发了一个名为 ReCOVery 的信息库,收集并提供新冠疫情相关的新闻,具体包括文本、图片、时间和网络信息等。为了提高数据集的规模,同时也更加保证标签的准确度,本文通过获取新闻媒体的可信度作为新闻的标签。我们对其中包含的数据进行各种实验,得到了数据的统计数据和分布,训练出了预测新闻真实性的基线性能,以便与将来的方法进行比较。
Jun, 2020
基于 CORD-19 文本摘要的 CORToViz 可视化工具,利用最新科技,通过聚类文章并提取主题的方法,提供快速可视化主题内容和趋势的交互式仪表盘,适用于任何文本文档语料库的数据准备和结果可视化。
Oct, 2023
本研究的主要目标是开发一种工具,将信息检索和提取技术应用于 COVID-19 开放研究数据集(CORD-19),为研究人员提供更好的 COVID-19 相关论文搜索工具,帮助他们找到参考论文并突出显示文本中的相关实体。
Jan, 2024
本研究通过多种数据源建立了多个机器学习模型对当前 COVID-19 研究场景进行了表征,包括识别潜在主题、分析出版物相似性和情感。结果表明 PubMed 和 ArXiv 中的研究类型存在显著区别,前者在 COVID-19 相关问题的多样性方面具有更大的多样性,后者则更关注预测 / 诊断 COVID-19 的智能系统 / 工具。研究团队对高危人群和并发症患者的特别关注也得到了证实。
Jul, 2020