关键词cross-modal tasks
搜索结果 - 6
  • Zipper:融合多模式的多塔解码器架构
    PDF17 days ago
  • CVPR正向增量对比学习在图像和视频字幕评估中的应用
    PDFa year ago
  • 一种分子多模基础模型,将分子图与自然语言相关联
    PDF2 years ago
  • ACLUNIMO-2: 端到端的统一视觉语言基础学习
    PDF2 years ago
  • ICMLOFA: 通过一个简单的序列到序列学习框架统一架构、任务和模态
    PDF2 years ago
  • AAAI通过场景图增强知识的视觉 - 语言表示:ERNIE-ViL
    PDF4 years ago
Prev
Next