关键词cross-modal attention
搜索结果 - 22
  • 基于局部到全局的跨模态注意力融合方法用于 HSI-X 语义分割
    PDF9 days ago
  • COLINGDELAN: 视觉与语言导航的双层对齐:跨模态对比学习
    PDF3 months ago
  • 情感维度识别中的递归跨模态注意力的多模态融合
    PDF3 months ago
  • ICLR论多模态推理中神经网络的泛化能力
    PDF5 months ago
  • 利用文本条件特征对齐进行音频增强的文本到视频检索
    PDFa year ago
  • 自动驾驶预训练视觉问答模型的性能分析
    PDFa year ago
  • 从二维集合中引导的文本生成三维人体
    PDFa year ago
  • CVPRDaGAN++:用于生成逼真视频的深度感知生成对抗网络
    PDFa year ago
  • MA-ViT:面部防欺诈的模态不敏感视觉变换器
    PDFa year ago
  • 跨模态注意力一致性正则化用于视觉语言关系对齐
    PDF2 years ago
  • 使用音频指导的预训练语言模型解释歌曲歌词
    PDF2 years ago
  • MM音视频显著性预测的双域对抗学习
    PDF2 years ago
  • 利用对话历史的语言和韵律语境进行端到端共情对话语音合成的声学建模
    PDF2 years ago
  • CVPR语言桥接的时空交互用于参考视频对象分割
    PDF2 years ago
  • CVPR跨媒体语言 - 视频注意力 X-Pool 在文本 - 视频检索中的应用
    PDF2 years ago
  • CVPR跨模态关注和语言的视听通用零样本学习
    PDF2 years ago
  • 注意力视觉关键词检测
    PDF3 years ago
  • MM-ViT:用于压缩视频动作识别的多模态视频 Transformer
    PDF3 years ago
  • AAAI正则化注意力网络在视觉问答异常检测中的应用
    PDF4 years ago
  • 自监督超声到 MRI 胎儿脑部图像合成
    PDF4 years ago
Prev