关键词multimodal pre-training
搜索结果 - 18
- MGI: 基因组和医学影像的多模态对比预训练PDFa month ago
- CVPR计算病理学中的基于转录组学指导的幻灯片表示学习PDFa month ago
- HiVG: 视觉引导的分层多模态细粒度调控PDF2 months ago
- ACLALOHa: 一种新的用于字幕模型中幻觉的评测指标PDF3 months ago
- 根据要求进行设计:利用视觉问答进行多模态预训练PDF3 months ago
- GS-CLIP: 从真实世界数据进行对比度语言 - 图像 - 3D 预训练的高斯飞溅PDF5 months ago
- MLIP:利用分歧编码器和知识引导的对比学习增强医学视觉表达PDF5 months ago
- ICCVFLIP: 跨领域人脸反欺骗技术与语言引导PDF9 months ago
- ULIP-2: 面向可伸缩的多模态 3D 预训练PDFa year ago
- 基于图文自监督训练的多模态预训练模型泛化算法PDFa year ago
- MMGA:基于图形对齐的多模式学习PDF2 years ago
- EMNLPHate-CLIPper:基于 CLIP 特征交叉模态交互的多模式仇恨恶搞分类PDF2 years ago
- AAAI极低资源并行数据下的自监督音频文本预训练PDF2 years ago
- ACL具有提示的模块化和参数高效的多模态融合PDF2 years ago
- ACLMarkupLM: 面向富媒体文档理解的文本和标记语言预训练PDF3 years ago
- LayoutXLM: 多模态预训练用于多语种视觉丰富文档理解PDF3 years ago
- ACLLightningDOT:用于实时图像文本检索的视觉 - 语义嵌入的预训练PDF3 years ago
- ECCV幕后揭秘:揭示预训练视觉语言模型的秘密PDF4 years ago
Prev
Next