BriefGPT.xyz
大模型
Ask
alpha
关键词
vlp framework
搜索结果 - 3
CVPR
增强病理检测的疾病描述分解:一种多方面的视觉语言匹配框架
通过咨询大型语言模型和医学专家,我们提出了一种新颖的 VLP 框架,将疾病描述分解为基本要素,利用对病理学可视表现的先前知识。通过整合 Transformer 模块,我们的方法将输入图像与疾病的多个要素进行对齐,生成以要素为中心的图像表示。
→
PDF
4 months ago
T3D:通过视觉 - 语言预训练实现三维医学图像理解
T3D 是为高分辨率 3D 医学图像设计的首个 VLP 框架,通过两个文本感知的预训练任务,即文本感知的对比学习和文本感知的图像恢复,从高分辨率的 3D 医学图像中学习 3D 视觉表示,整合临床知识,拥有在器官和肿瘤分割以及疾病分类等任务中
→
PDF
7 months ago
Zero and R2D2: 一个大规模的中文跨模态基准和视觉语言框架
该研究报告介绍了一个面向中文语料库的大规模高质量跨模态基准(ZERO),该基准包含了最大的公共预训练数据集 ZERO-Corpus 和用于下游任务的五个人工注释微调数据集,并且提出了一个基于预排序和排序机制的 VLP 框架(R2D2),该框
→
PDF
2 years ago
Prev
Next