BriefGPT.xyz
大模型
Ask
alpha
关键词
image embedders
搜索结果 - 1
MLIM: 带掩码语言和图像建模的视觉语言模型预训练
本文介绍了一种新的 VLP 方法:MLIM,它使用 Masked Language Modeling 和 Image Reconstruction 两种损失函数以及 Modality Aware Masking 技术来增强语言和图片之间的交
→
PDF
3 years ago
Prev
Next