关键词cross-modal
搜索结果 - 23
  • 反馈对齐的混合 LLMs 用于机器语言分子翻译
    PDFa month ago
  • AAAIDGL: 文本 - 视频检索的动态全局 - 局部提示调优
    PDF5 months ago
  • 交叉 BERT 用于点云预训练
    PDF7 months ago
  • 自适应生成可见光红外人员再识别的特权中间信息
    PDFa year ago
  • 增强虚拟助手智能力:针对元数据以外的实例级用户意图的精准区域定位
    PDFa year ago
  • Cross2StrA: 无配对跨语言图像字幕生成与跨语言跨模态结构中心对齐
    PDFa year ago
  • SpeechGPT:赋能大型语言模型具备内在的跨模态对话能力
    PDFa year ago
  • 视频问答的视觉因果场景细化
    PDFa year ago
  • ICLR跨模态三维物体检测的双向传播
    PDFa year ago
  • AAAITimbreCLIP: 连接音质、文本和图像
    PDF2 years ago
  • ECCV学习自我监督跨模态互相调制的超分辨率
    PDF2 years ago
  • 跨视角语言建模:朝向统一的跨语言跨模态预训练
    PDF2 years ago
  • AAAI极低资源并行数据下的自监督音频文本预训练
    PDF2 years ago
  • MMCommerceMM: 基于全检索的大规模商业多模态表示学习
    PDF2 years ago
  • OPT: Omni-Perception Pre-Trainer 用于跨模态理解和生成
    PDF3 years ago
  • MM周期内总生成:循环生成对抗网络用于生成人脸、手、身体和自然场景
    PDF3 years ago
  • ECCVMaCLR: 面向视频的动态感知对比学习表征
    PDF3 years ago
  • 跨模态视频文字检索的记忆增强嵌入学习
    PDF3 years ago
  • 我的多模型是否学习了跨模态交互?比你想象的更难判断!
    PDF4 years ago
  • 通过多粒度图像文本对齐 提高基于描述的人员再识别
    PDF5 years ago
Prev