关键词multimodal tasks
搜索结果 - 43
  • 模式逼近生成优秀的视觉语言提示
    PDFa year ago
  • MaMMUT:联合学习多模态任务的简单架构
    PDFa year ago
  • eP-ALM: 语言模型的高效感知增强
    PDFa year ago
  • 多模视觉监督对语言有益吗?
    PDFa year ago
  • MultiInstruct: 通过指令调整提高多模态零样本学习
    PDF2 years ago
  • CVPR利用语义完形学习进行视觉语言预训练的漏洞填补
    PDF2 years ago
  • AAAI探索预训练检查点在文本生成音乐任务中的功效
    PDF2 years ago
  • EMNLPFaD-VLP: 面向统一检索和说明的时尚视觉语言预训练
    PDF2 years ago
  • EMNLPMM-Align: 基于最优输运的对齐动力学学习,以实现快速准确推断缺失模态序列
    PDF2 years ago
  • TVLT: 无文本的视觉语言变换器
    PDF2 years ago
  • PaLI: 一个共同缩放的多语言语言图像模型
    PDF2 years ago
  • CLiMB: 用于视觉语言任务的持续学习基准
    PDF2 years ago
  • 语言模型的视野:在文本生成中插入视觉控制
    PDF2 years ago
  • 动态多模态融合
    PDF2 years ago
  • CVPR通过即时梯度调控实现平衡多模态学习
    PDF2 years ago
  • 具有可操作感知的多模态神经 SLAM 学习行为
    PDF2 years ago
  • AAAIGPT-3 对少样本基于知识的 VQA 的经验研究
    PDF3 years ago
  • ACLGEM: 多模态任务通用评估基准
    PDF3 years ago
  • ECCV早期融合和批次规范对 CLEVR 视觉问答中细节的影响
    PDF6 years ago
  • 基于注意力机制的视听融合在强鲁棒性自动语音识别中的应用
    PDF6 years ago