BriefGPT.xyz
Ask
alpha
关键词
cross-modal domain knowledge
搜索结果 - 1
医学视觉与语言预训练的多模态掩码自编码器
提出了一种基于 M$^3$AE 的自监督学习模型,通过随机遮盖图像和文本中的像素和标记来学习跨模态领域知识的医学视觉语言模型,并在三个任务上实现了最先进水平的结果。
PDF
2 years ago
Prev
Next