关键词cross-modal fusion
搜索结果 - 19
  • SimTxtSeg:基于简单文本线索的弱监督医学图像分割
    PDF5 days ago
  • 通过情感跨模态融合和类间对比学习提升对话中的情感识别
    PDFa month ago
  • 跨模态适配器:用于视觉语言模型的参数高效迁移学习方法
    PDF2 months ago
  • CVPRSnAG: 视频定位的可扩展和准确性
    PDF3 months ago
  • AAAI频谱对多模态表示和融合更为有效:一种多模态频谱谣言检测器
    PDF6 months ago
  • 利用多模态球面图像进行单帧语义分割
    PDF10 months ago
  • 通过唇语子词相关性进行视觉预训练和交叉模态融合编码的提高音频视觉语音识别
    PDFa year ago
  • EgoVLPv2: 骨干网络中融合的自我中心视频语言预训练
    PDFa year ago
  • 多模态谣言检测的知识增强层次信息相关学习
    PDFa year ago
  • ViLaS: 将视觉和语言集成到自动语音识别中
    PDFa year ago
  • 多模态假新闻检测的跨模态对比学习
    PDFa year ago
  • ACL多模态事件转换器用于图像引导的故事结尾生成
    PDFa year ago
  • 语言理解通用多模态表示
    PDFa year ago
  • MACSA: 一个多模态的方面 - 类别情感分析数据集,包含多模态细粒度对齐注释
    PDF2 years ago
  • SIGIR混合模态查询下的图像检索渐进式学习
    PDF2 years ago
  • 一种简单且高效的端到端图像描述方法
    PDF2 years ago
  • CVPRLAVT:用于参照图像分割的语言感知视觉 Transformer
    PDF3 years ago
  • MM基于深度品质启发的特征操作,用于高效的 RGB-D 显著性对象检测
    PDF3 years ago
  • ACLVLM: 任务无关的视频语言模型预训练,用于视频理解
    PDF3 years ago
Prev
Next