关键词vision-language alignment
搜索结果 - 11
  • 多模态大型语言模型中标记压缩与语义抽象的解耦
    PDFa month ago
  • 一种中间融合的 ViT 在扩散模型中实现了高效的文本 - 图像对齐
    PDF3 months ago
  • RESTORE: 面向视觉语言提示学习的特征偏移
    PDF4 months ago
  • CLIM:用于区域表示的对比性语言 - 图像拼贴
    PDF7 months ago
  • PneumoLLM: 利用大型语言模型进行尘肺病诊断
    PDF7 months ago
  • 使用事实增强的 RLHF 对齐大型多模型
    PDF9 months ago
  • VGDiffZero: 文本到图像扩散模型可以进行零射击视觉定位
    PDF10 months ago
  • MM纯文本训练视觉叙事
    PDFa year ago
  • MM弱监督视频时刻定位的反事实跨模态推理
    PDFa year ago
  • 学习排序遇见语言:提升基于语言的序列分类的排序对齐
    PDFa year ago
  • X-DETR:一种用于实例级视觉 - 语言任务的通用架构
    PDF2 years ago
Prev
Next