BriefGPT.xyz
大模型
Ask
alpha
关键词
medical vqa
搜索结果 - 4
通过梯度引导的模型扰动增强医学视觉问答任务的泛化能力
通过利用预训练的视觉语言模型,并结合数据增强、正则化方法以及基于梯度引导的参数扰动,该研究提出了一种改善医学可视化问答任务的模型泛化性能的方法,并在两个数据集上获得了有竞争力的结果。
PDF
4 months ago
利用单模态和多模态对比损失进行带有遮掩视觉和语言预训练,用于医学视觉问答
本文提出了一种新的自我监督方法来处理医学图像视觉问答问题,通过利用医学图像标题数据集来学习输入图像和文本的单模和多模特征表示,预训练模型后将其转移到下游的医学 VQA 任务中,已在三个公开的医学 VQA 数据集上取得了最先进的表现,具有显着
→
PDF
a year ago
医学视觉问答中的本地化问题
文章提出了一种针对医学图像的视觉问答模型,该模型能够考虑上下文并回答关于图片区域的问题,实验结果表明该方法在三个数据集上优于现有方法。
PDF
a year ago
PMC-CLIP:使用医学文献进行对比语言 - 图像预训练
本文介绍了一种基于 PMC-OA 生物医学数据集的 CLIP-style 预训练模型,该模型在多项下游任务中取得了最先进的结果,包括 ROCO 的图像文本检索、MedMNIST 的图像分类和医学 VQA。
PDF
a year ago
Prev
Next