关键词multimodal representations
搜索结果 - 24
  • 医学表征学习的视觉 - 语言对比方法的基准评估
    PDF19 days ago
  • 放射学中的医学图像自由形式问答
    PDF5 months ago
  • 提升图像 - 文本预训练中的细粒度理解
    PDF5 months ago
  • 音频文本分类的级联交叉模态 Transformer
    PDF5 months ago
  • 提升多模态情感分析:基于受监督的角度边界对比学习的增强融合表征
    PDF7 months ago
  • 具有稳健遗忘机制的生命周期音视频屏蔽自编码器与局部对齐
    PDF9 months ago
  • 音频视频领域的对比学习探索
    PDF10 months ago
  • MultiZoo 和 MultiBench:多模态深度学习的标准化工具包
    PDFa year ago
  • 利用图像 - 语言基础模型识别人脑中共同可解码的概念
    PDFa year ago
  • 多模态预训练中视觉关系的弱监督学习
    PDFa year ago
  • IJCAI跨模态全局交互与局部对齐的视听语音识别
    PDFa year ago
  • 视觉语言预训练的改进基线
    PDFa year ago
  • CoCa: 对比式字幕生成模型是图像文本基础模型
    PDF2 years ago
  • MMMARMOT:一个用于构建视觉 - 语言任务的多模态表征的深度学习框架
    PDF3 years ago
  • ROSITA: 通过跨模态和内部模态知识整合提升视觉语言语义对齐
    PDF3 years ago
  • MultiBench: 多模态表示学习的多尺度基准
    PDF3 years ago
  • VATT:用于原始视频、音频和文本的多模态自监督学习的 Transformer 模型
    PDF3 years ago
  • CVPR跨模态检索中的持续学习
    PDF3 years ago
  • UC2: 通用跨语言跨模态视觉语言预训练
    PDF3 years ago
  • AAAI利用文档级结构信息进行图像 - 句子匹配的无监督采样方法
    PDF3 years ago
Prev