COVID-19 问题分类数据集
构建一个问题回答数据集,用於评估基於 COVID-19 相关主题的各种基线模型的转移能力和效果。該数据集包括 124 个问题 - 文章对,但不足以进行监督的机器学习。
Apr, 2020
本论文介绍了 covidAsk,一个基于生物医学文本挖掘和问答技术结合起来的用于实时回答问题的问答系统,并使用 COVID-19 Questions 数据集对其进行了评估。该系统被设计来帮助研究人员寻找关于新冠病毒和未来疫情的知识和信息。
Jun, 2020
介绍了一个具有挑战性的大型 COVID-19 FAQ 检索数据集 COUGH,包括 FAQ Bank、Query Bank 和 Relevance Set,其中最佳模型在 P@5 下达到了 48.8,激励了更多的研究。
Oct, 2020
Vietnamese researchers presented UIT-ViCoV19QA, the first community-based question answering dataset for COVID-19 from trusted medical sources with multiple paraphrased answers evaluated through deep learning models using commonly used metrics, mainly BLEU, METEOR, and ROUGE-L, which demonstrated significant improvements, and concluded that the deep learning method, especially the Transformer architecture, is dominant in the field of study.
Sep, 2022
开发了基于机器学习的网络应用程序,用于自动分类社交媒体上的 COVID-19 相关讨论,并提供了用于分类的基准结果。
Feb, 2024
本文利用 GPT-2 语言模型,结合 tf-idf、BERT、BioBERT、USE 四种过滤方法,开发了一款自动回答有关 COVID-19 的聊天机器人,并通过医学专家评估,发现 BERT 和 BioBERT 优于 tf-idf 和 USE,以提供正确、即时、有用的健康数据。同时,还创建了一款用户友好型的互动网络应用程序。
Jun, 2020
利用预训练神经网络上的双重微调方法,先使用医疗问答对进行预训练,然后使用医学问答对进行微调,以确定医学问题的相似性,特别适用于 COVID-19 相关问答系统匹配用户问题。
Aug, 2020
本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现,发现在该数据集上微调过的预训练语言模型表现最佳,并探讨了其数据效率和可推广性,同时也提出了未来研究中需要解决的问题,数据和代码均在 GitHub 上可获取。
Jun, 2020
本研究采用现代自然语言处理技术设计了一个基于问题回答系统,以应对 COVID-19 大规模信息泛滥和不实传言。我们依据 Ingwersen 的信息检索认知模型,从社会技术角度推导并转化成具体的设计要求和设计原则,并以 CORD-19 数据集为基础构建了一个样机系统。我们根据生物医学专家标记的 COVID-19 问题样本,评估了系统的答案质量,证明了其有用性。
Apr, 2022
本文介绍了一个建立在可靠的 COVID-19 网站数据集基础上的、面向世界各地用户的信息汇聚系统,该系统可帮助用户查找各地的 COVID-19 相关新闻,并通过神经机器翻译和基于 BERT 的主题分类器帮助用户高效地获取自己感兴趣的信息。
Jul, 2020