使用干扰项和提示掩盖为医疗问答生成多选题

Mar, 2023

使用干扰项和提示掩盖为医疗问答生成多选题

Generating multiple-choice questions for medical question answering with distractors and cue-masking

Damien Sileo, Kanimozhi Uma, Marie-Francine Moens

TL;DR本文通过在医学百科全书段落中以疾病名称预测为重点的 Masked Language Modeling 方法，提高了医学多项选择题回答准确率；本文还展示了基于生成的 MCQA 数据集的 fine-tuning 方法胜过基于 MLM 的方法，并且正确遮盖答案线索对于良好表现非常关键。我们发布了新的预训练数据集，并在 4 个 MCQA 数据集上实现了最新最好的结果，在 MedQA-USMLE 上基础型号效果提高了 5.7%。

Abstract

medical multiple-choice question answering (MCQA) is particularly difficult. Questions may describe patient symptoms and ask for the correct diagnosis, which requires domain knowledge and complex reasoning. Standard language modeling pretraining alone is not sufficient to achieve the b

medical multiple-choice question answering masked language modeling disease name prediction fine-tuning pretraining datasets

发现论文，激发创造

大型语言模型在医学科目多选题分类中的应用

通过训练大规模语言模型来判别医学问题，我们使用多问题序列 BERT 方法训练深度神经网络，实现了在医学多选题数据集上 0.68 和 0.60 的准确率，展示了人工智能和大规模语言模型在医疗领域多分类任务中的能力。

Mar, 2024

利用实体感知屏蔽策略提高低资源生物医学问答性能

本文提出了一种称为生物医学实体感知蒙版 (BEM) 的简单方法，以帮助受限于特定领域及其 COVID-19 文献的预训练语言模型进行微调，从而提升其生物医学问答数据集的性能。实验证明，该方法与先进模型具有相同的性能。

Feb, 2021

医学视觉问答的自监督视觉语言预训练

本文介绍了一种自我监督方法 - 对遮蔽图像建模、遮蔽语言建模、图像文本匹配和图像文本对齐进行对比学习的 M2I2 方法，应用于医学图像字幕数据集的预训练，并对下游医学 VQA 任务进行微调。该方法在三个公共医学 VQA 数据集上实现了最先进的性能。

Nov, 2022

MedMCQA：医学领域问题回答的大规模多学科多选择题数据集

MedMCQA 是一个新的大型多项选择题答题数据集，收集了超过 194,000 个高质量的 AIIMS 和 NEET PG 考试的 MCQs，涵盖 2,400 多个医疗主题和 21 个医学科目，并测试模型在广泛的医学主题和话题上的 10 + 种推理能力。

Mar, 2022

利用单模态和多模态对比损失进行带有遮掩视觉和语言预训练，用于医学视觉问答

本文提出了一种新的自我监督方法来处理医学图像视觉问答问题，通过利用医学图像标题数据集来学习输入图像和文本的单模和多模特征表示，预训练模型后将其转移到下游的医学 VQA 任务中，已在三个公开的医学 VQA 数据集上取得了最先进的表现，具有显着的准确度提高。

Jul, 2023

根据要求进行设计：利用视觉问答进行多模态预训练

我们利用多模态预训练中的视觉问题回答（VQA）指导框架，聚焦目标病理特征，通过医学报告中的描述设计了关联不同疾病的多粒度问题 - 答案对，并提出了一种基于准文本特征变换的新型预训练框架，将视觉特征转化为接近文本领域的准文本空间，缩小了视觉 - 语言差距，实现了模态对齐。在四个下游任务（报告生成、分类、分割和检测）的五个数据集上，广泛的实验证明了我们的框架相比其他最先进的方法的优越性。我们的代码将在接受后发布。

Mar, 2024

线索优先：增强型多项选择题解答

该论文介绍了一种基于文本生成模型的、通过生成提示信息来提高多项选择题的准确性的算法 GenMC，该算法在多项选择题上的表现优于传统文本生成模型。

Apr, 2022

战略性学习：学习如何在闭卷问答中进行遮盖

通过训练遮盖策略，从而在中间预训练阶段将任务相关知识封装到语言模型的参数中，该方法在 TriviaQA 上的表现优于强启发式方法，而用于 BART 的表现则更为强大。

Dec, 2020

FrenchMedMCQA：一份针对医学领域的法语多项选择题答题数据集

该论文介绍了 FrenchMedMCQA，即用于医学领域的多项选择问答（MCQA）的首个公开数据集，其中包含从法国药学专业毕业考试中提取的 3105 个问题，使用单选和多选题混合，提供基线模型以自动处理此 MCQA 任务。

Apr, 2023

多项选择题与大型语言模型：以虚构医疗数据为例的案例研究

利用模拟医学考题的方法评估大型语言模型在医学领域的表现，发现传统的多项选择题评估方法可能无法准确测量其临床知识和推理能力，而更强调其模式识别技能。这项研究强调了需要更强劲的评估方法，以更好地评估大型语言模型在医学背景下的真实能力。

Jun, 2024