Huatuo-26M，一个大规模的中文医学问答数据集

May, 2023

Huatuo-26M，一个大规模的中文医学问答数据集

Huatuo-26M, a Large-scale Chinese Medical QA Dataset

Jianquan Li, Xidong Wang, Xiangbo Wu, Zhiyi Zhang, Xiaolong Xu...

TL;DR本研究释放了一个含有 2600 万问答对的医疗问答数据集，并通过检索和生成方面的基准测试了许多现有方法，结果表明，现有模型的表现远远低于预期，并且该数据集在预训练语言模型时代仍然具有挑战性。此外，本研究实验证明了所提出的数据集在许多方面的好处，即模型零 - shot 训练、用作检索 - 生成的外部知识和在持续训练中使用问答对作为预训练语料库来提高现有预训练语言模型的性能。我们相信，该数据集不仅将有助于医学研究，而且还将有助于患者和临床医生们。

Abstract

In this paper, we release a largest ever medical question answering (QA) dataset with 26 million QA pairs. We benchmark many existing appr

medical question answering dataset pre-trained language model improvement

发现论文，激发创造

医学考试开放领域大规模问答数据集：这位病人患有何种疾病？

本研究提供了首个针对医疗问题的自由形式多项选择 OpenQA 数据集 MedQA，涵盖三种语言，并通过实现规则和神经网络两种方法进行实验，最终发现即使是当前最好的方法在英语、繁体中文和简体中文问题上也只能实现 36.7％、42.0％和 70.1％的测试准确率，希望这个数据集能够为推动未来更强大的 NLP OpenQA 模型的发展提供平台。

Sep, 2020

RJUA-QA：一份完整的泌尿科问答数据集

我们介绍了 RJUA-QA，这是一个新颖的医学数据集，用于问题回答和与临床证据推理，有助于弥合通用大型语言模型（LLMs）与医学特定 LLM 应用之间的差距。

Dec, 2023

emrQA：基于电子病历的问题回答的大型语料库

通过重新利用其他 NLP 任务的现有注释，我们提出了一种新的方法来生成特定领域的大规模问答（QA）数据集。我们利用社区共享的 i2b2 数据集中临床笔记的现有专家注释，生成了大规模的电子医疗记录 QA 数据集 emrQA，其中包含 100 万个问题 - 逻辑形式对和 40 多万个问题 - 答案证据对，并通过基线模型训练来探索其学习潜力。

Sep, 2018

TCMD：一个用于评估大型语言模型的中医问答数据集

通过引入新的医学问答数据集 TCMD，本文评估了不同领域通用语言模型和医学领域特定语言模型在中医领域的能力，并分析了它们在中医问答任务中的鲁棒性及其存在的不足。希望该数据集进一步促进中医领域通用语言模型的发展。

Jun, 2024

MedChatZH：一个更好的医疗顾问从更好的指南中学习

使用生成型的大型语言模型，在中医问答领域表现令人不满意，本研究引入了一个专门为中医问答设计的对话模型 MedChatZH，该模型在中医经典著作上进行预训练，并结合医学指南数据进行精细调优，在真实的医学对话数据集上胜过了几个基线模型。我们在链接上发布了我们的模型、代码和数据集，以促进传统中医和大型语言模型领域的进一步研究。

Sep, 2023

医学问答对生成

本文介绍了一种基于自动生成问答对的框架，包含一个无监督关键词检测器发现问题的有效性，一个生成器利用多通道解码器提高结构知识的多样性，用于医学领域的问答任务，能有效提升考试问答系统的准确率。

Nov, 2018

PsyQA：中文心理健康辅导长文生成数据集

本文提出 PsyQA 数据集 - 一份汇集了 2.2 万个问题和 5.6 万个答案的中文心理健康支持数据集。该数据集基于心理咨询理论进行标注，包含典型支持策略和词汇特征，同时通过使用生成预训练模型进行答案生成并取得了成功，但这方面仍有很大的研究空间。

Jun, 2021

CCQA：用于模型预训练的新型 Web 规模问答数据集

本文提出一种在 Common Crawl 项目的基础上，使用大规模、自然、多样化问答数据集进行领域内预训练的方法，该方法可以用于 open-domain question-answering 任务中的零样本、低资源和微调设置，展示了预训练在该任务中的潜力。

Oct, 2021

MedMCQA：医学领域问题回答的大规模多学科多选择题数据集

MedMCQA 是一个新的大型多项选择题答题数据集，收集了超过 194,000 个高质量的 AIIMS 和 NEET PG 考试的 MCQs，涵盖 2,400 多个医疗主题和 21 个医学科目，并测试模型在广泛的医学主题和话题上的 10 + 种推理能力。

Mar, 2022

ViMQ：面向医疗对话系统开发的越南医疗问题数据集

本研究发布了一个越南的医疗问题数据集，具有句子层次和实体层次的注释，旨在改善基于任务的医疗聊天机器人对病人问题的理解能力，并提出了一种自监督的训练策略。

Apr, 2023