May, 2023

面向病毒 - 宿主相互作用提取的新数据集

TL;DR我们描述了一种用于自动识别与病毒和宿主相关的命名分类和其他实体的新数据集,并进一步描述了使用预训练模型在该新数据集上进行命名实体识别(NER)任务的一些初步结果。我们建议,我们手动注释的摘要数据集现在为未来训练自动从科学出版物中提取宿主 - 病原体检测方法的 NER 模型提供了金标准语料库,并进一步解释了我们的工作如何自动从科学文献中预测重要的与人类健康相关的病毒溢出风险的概念。