关键词multimodal pre-training
搜索结果 - 18
  • MGI: 基因组和医学影像的多模态对比预训练
    PDFa month ago
  • CVPR计算病理学中的基于转录组学指导的幻灯片表示学习
    PDFa month ago
  • HiVG: 视觉引导的分层多模态细粒度调控
    PDF2 months ago
  • ACLALOHa: 一种新的用于字幕模型中幻觉的评测指标
    PDF3 months ago
  • 根据要求进行设计:利用视觉问答进行多模态预训练
    PDF3 months ago
  • GS-CLIP: 从真实世界数据进行对比度语言 - 图像 - 3D 预训练的高斯飞溅
    PDF5 months ago
  • MLIP:利用分歧编码器和知识引导的对比学习增强医学视觉表达
    PDF5 months ago
  • ICCVFLIP: 跨领域人脸反欺骗技术与语言引导
    PDF9 months ago
  • ULIP-2: 面向可伸缩的多模态 3D 预训练
    PDFa year ago
  • 基于图文自监督训练的多模态预训练模型泛化算法
    PDFa year ago
  • MMGA:基于图形对齐的多模式学习
    PDF2 years ago
  • EMNLPHate-CLIPper:基于 CLIP 特征交叉模态交互的多模式仇恨恶搞分类
    PDF2 years ago
  • AAAI极低资源并行数据下的自监督音频文本预训练
    PDF2 years ago
  • ACL具有提示的模块化和参数高效的多模态融合
    PDF2 years ago
  • ACLMarkupLM: 面向富媒体文档理解的文本和标记语言预训练
    PDF3 years ago
  • LayoutXLM: 多模态预训练用于多语种视觉丰富文档理解
    PDF3 years ago
  • ACLLightningDOT:用于实时图像文本检索的视觉 - 语义嵌入的预训练
    PDF3 years ago
  • ECCV幕后揭秘:揭示预训练视觉语言模型的秘密
    PDF4 years ago
Prev
Next