关键词modality gap
搜索结果 - 35
  • ICML跨模态迁移的学习模态知识对齐
    PDF5 days ago
  • 缓解差距:研究提升 CLIP 中跨模态对齐的方法
    PDF7 days ago
  • 面向文本属性的隐式模态对齐的人物搜索
    PDFa month ago
  • 文本反转与自监督精炼的放射学报告生成
    PDFa month ago
  • 非模态鸿沟:对比鸿沟的特征与解决
    PDFa month ago
  • SHE-Net:语法层次增强的文本 - 视频检索
    PDF2 months ago
  • 两种效应,一个触发器:关于对比式视觉语言表示学习中的模态差异、物体偏见和信息不平衡
    PDF3 months ago
  • CVPRSDSTrack: 自蒸馏对称适配器学习用于多模态视觉目标跟踪
    PDF3 months ago
  • 填补视觉语言模型选择中的模态和容量差距
    PDF3 months ago
  • CLEAR:基于预训练语言模型的交叉变压器在个人属性识别和检索中的应用
    PDF4 months ago
  • Finer: 大规模视觉语言模型中细粒度视觉概念识别的研究与增强
    PDF4 months ago
  • 逐步推进零尾到尾语音翻译的极限
    PDF5 months ago
  • ICLR连接,塌陷,腐败:利用单模态数据学习跨模态任务
    PDF6 months ago
  • 基于 CLIP 的可见光 - 红外人员再识别的语义发现网络
    PDF6 months ago
  • AAAI通过仅文本训练挖掘细粒度的图像 - 文本对齐用于零样本字幕生成
    PDF6 months ago
  • AAAI通过合成对的方法改善文本式图像描述的跨模态对齐
    PDF7 months ago
  • CLIP 的零射类别视觉分类的内部模态代理学习
    PDF8 months ago
  • ProtoHPE: 基于原型引导的高频补丁增强可见 - 红外人员再识别
    PDF9 months ago
  • I2SRM: 跨样本关系建模用于多模态信息提取
    PDF9 months ago
  • 基于文本 - only 训练实现的弱监督自动音频字幕生成
    PDF9 months ago
Prev