关键词vision-language models
搜索结果 - 351
  • 通过强化学习将大型视觉语言模型细调为决策代理
    PDF4 days ago
  • 联合提示学习中通用化与个性化的协调
    PDF4 days ago
  • 通过相邻区域注意力对齐进行开放式目标检测
    PDF6 days ago
  • 推动科学中的 AI 公平性:通用领域提示学习助力面向普及的 VLM 研究
    PDF6 days ago
  • 改进提示调整中的文本语义是否可以提高 VLM 的泛化能力?
    PDF7 days ago
  • ICML面向高效视觉 - 语言微调的记忆空间视觉提示
    PDF11 days ago
  • CVPRTHRONE: 一个基于物体的幻觉评估基准,用于自由形态大型视觉语言模型的生成
    PDF12 days ago
  • 学会看但忘记跟随:视觉指令调整使 LLMs 更容易遭受越狱攻击
    PDF13 days ago
  • 图像智能描述技术研究与应用
    PDF15 days ago
  • 关于视觉语言模型的测试时零样本泛化:我们真的需要提示学习吗?
    PDF17 days ago
  • 构建视觉 - 语言模型时的要点
    PDF17 days ago
  • V-FLUTE: 视觉比喻语言理解与文本解释
    PDF18 days ago
  • 上下文符号回归:利用语言模型进行函数发现
    PDF21 days ago
  • 医学视觉语言预训练用于脑部异常
    PDF23 days ago
  • BlenderAlchemy:使用视觉语言模型编辑 3D 图形
    PDF24 days ago
  • 拥抱多样性:超过每个类别一个向量的可解释零 - shot 分类
    PDF25 days ago
  • ACL融合领域适应视觉和语言模型的医学视觉问答
    PDFa month ago
  • 利用类别共现概率提升多标签识别
    PDFa month ago
  • FINEMATCH:基于方面的细粒度图像与文本不匹配检测与校正
    PDFa month ago
  • 使用来自视觉 - 语言模型的通用表示进行驾驶员活动分类
    PDFa month ago
Prev