关键词multimodal alignment
搜索结果 - 15
  • 通过无需训练的码书优化和分层对齐发掘多模态统一离散表示的潜能
    PDF4 months ago
  • CVPRMADTP:多模态对齐引导的动态标记修剪加速视觉 - 语言转换器
    PDF4 months ago
  • SyCoCa: 对称化的关注屏蔽对齐的对比式字幕生成器
    PDF6 months ago
  • 参数高效调节与通用视觉语言模型的结合
    PDF7 months ago
  • 在单个 GPU 上的数据有效多模态融合
    PDF7 months ago
  • OneLLM:一种将所有模态与语言对齐的框架
    PDF7 months ago
  • 大型 AI 模型赋能的多模态语义通信
    PDF10 months ago
  • 语言知识能够改善视觉 - 语言预训练中的多模态对齐吗?
    PDF10 months ago
  • ICCVMEGA: 电影视频分割的多模态对齐、聚合与蒸馏
    PDF10 months ago
  • 用于视觉 - 语言表示学习的人工脉冲分层网络
    PDFa year ago
  • ICPC:基于对照学习的实例条件提示的语义分割
    PDFa year ago
  • Paxion: 在视频 - 语言基础模型中修补动作知识
    PDFa year ago
  • 用于高效视频文本检索的掩码对比预训练
    PDF2 years ago
  • 音乐对比语音学习
    PDF2 years ago
  • MMDSSL:基于深度学习的文本人物检索中的深层环境与人物分离学习
    PDF3 years ago
Prev
Next