COVID-19 问题分类数据集

ACLMay, 2020

What Are People Asking About COVID-19? A Question Classification Dataset

Jerry Wei, Chengyu Huang, Soroush Vosoughi, Jason Wei

TL;DRCOVID-Q 是一个包含 1690 个与 COVID-19 有关的问题的数据集，其中包含了来自 13 个来源的问题，并将它们分成了 15 个问题类别和 207 个问题簇。该数据集可以帮助开发相关系统或作为模型评估的领域特定的资源。

Abstract

We present covid-q, a set of 1,690 questions about COVID-19 from 13 sources, which we annotate into 15 question categories and 207 question clusters. The most common →

covid-q questions annotations transmission prevention

发现论文，激发创造

快速为 COVID-19 引导一个问答数据集

构建一个问题回答数据集，用於评估基於 COVID-19 相关主题的各种基线模型的转移能力和效果。該数据集包括 124 个问题 - 文章对，但不足以进行监督的机器学习。

Apr, 2020

实时回答 COVID-19 问题

本论文介绍了 covidAsk，一个基于生物医学文本挖掘和问答技术结合起来的用于实时回答问题的问答系统，并使用 COVID-19 Questions 数据集对其进行了评估。该系统被设计来帮助研究人员寻找关于新冠病毒和未来疫情的知识和信息。

Jun, 2020

COUGH: 用于 COVID-19 常见问题解答检索的挑战数据集和模型

介绍了一个具有挑战性的大型 COVID-19 FAQ 检索数据集 COUGH，包括 FAQ Bank、Query Bank 和 Relevance Set，其中最佳模型在 P@5 下达到了 48.8，激励了更多的研究。

Oct, 2020

UIT-ViCoV19QA: 一份越南语 COVID-19 社区问答数据集

Vietnamese researchers presented UIT-ViCoV19QA, the first community-based question answering dataset for COVID-19 from trusted medical sources with multiple paraphrased answers evaluated through deep learning models using commonly used metrics, mainly BLEU, METEOR, and ROUGE-L, which demonstrated significant improvements, and concluded that the deep learning method, especially the Transformer architecture, is dominant in the field of study.

Sep, 2022

COVIDHealth: 一个基于 Twitter 的数据集和基于机器学习的网络应用程序，用于分类 COVID-19 讨论

开发了基于机器学习的网络应用程序，用于自动分类社交媒体上的 COVID-19 相关讨论，并提供了用于分类的基准结果。

Feb, 2024

COVID-19 自动问答任务的语言模型质量评估

本文利用 GPT-2 语言模型，结合 tf-idf、BERT、BioBERT、USE 四种过滤方法，开发了一款自动回答有关 COVID-19 的聊天机器人，并通过医学专家评估，发现 BERT 和 BioBERT 优于 tf-idf 和 USE，以提供正确、即时、有用的健康数据。同时，还创建了一款用户友好型的互动网络应用程序。

Jun, 2020

有效的迁移学习方法用于相似问题鉴定：用户问题匹配 COVID-19 常见问题解答

利用预训练神经网络上的双重微调方法，先使用医疗问答对进行预训练，然后使用医学问答对进行微调，以确定医学问题的相似性，特别适用于 COVID-19 相关问答系统匹配用户问题。

Aug, 2020

COVID-19 文献的分类

本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现，发现在该数据集上微调过的预训练语言模型表现最佳，并探讨了其数据效率和可推广性，同时也提出了未来研究中需要解决的问题，数据和代码均在 GitHub 上可获取。

Jun, 2020

COVID-19 最初是在哪里发现的？为流行病情境设计问答系统

本研究采用现代自然语言处理技术设计了一个基于问题回答系统，以应对 COVID-19 大规模信息泛滥和不实传言。我们依据 Ingwersen 的信息检索认知模型，从社会技术角度推导并转化成具体的设计要求和设计原则，并以 CORD-19 数据集为基础构建了一个样机系统。我们根据生物医学专家标记的 COVID-19 问题样本，评估了系统的答案质量，证明了其有用性。

Apr, 2022

全球 COVID-19 信息聚合系统

本文介绍了一个建立在可靠的 COVID-19 网站数据集基础上的、面向世界各地用户的信息汇聚系统，该系统可帮助用户查找各地的 COVID-19 相关新闻，并通过神经机器翻译和基于 BERT 的主题分类器帮助用户高效地获取自己感兴趣的信息。

Jul, 2020