关键词large vision language models
搜索结果 - 20
  • MedThink:通过思考减少幻觉的诱导医学大规模视觉语言模型
    PDF17 days ago
  • 通过双模式对抗启示破解视觉语言模型
    PDFa month ago
  • 利用图像理解的自我训练增强大型视觉语言模型
    PDFa month ago
  • MetaToken: 通过元分类检测图像描述中的虚构
    PDFa month ago
  • 不忘初心:大规模视觉语言模型的关注力视觉校准
    PDFa month ago
  • RITUAL:随机图像变换作为 LVLM 中的通用抗幻觉杠杆
    PDFa month ago
  • 通过精细的人工智能反馈检测和缓解大型视觉语言模型中的幻觉
    PDF2 months ago
  • ECOR:面向目标识别的可解释 CLIP
    PDF2 months ago
  • HOI-Ref:基于主体视角的手 - 物体交互引用
    PDF3 months ago
  • 利用大型语言和视觉模型通过程序生成的三维场景表示探索未知环境的机器人
    PDF3 months ago
  • CVPRSC-Tune:解锁大型视觉语言模型中的自洽参考理解
    PDF3 months ago
  • Griffon v2: 提升高分辨率缩放和视觉语言共识的多模态感知
    PDF4 months ago
  • 大型视觉语言模型中评估和缓解数字幻觉:一种一致性视角
    PDF4 months ago
  • 大型视觉语言模型的图像推理与描述的认知评估基准
    PDF4 months ago
  • Hal-Eval: 一个用于大型视觉语言模型的通用且精细的幻觉评估框架
    PDF4 months ago
  • ViGoR: 用细粒度的奖励建模提高大型视觉语言模型的视觉关联能力
    PDF5 months ago
  • 小型语言模型与增强式视觉词汇的相遇
    PDF5 months ago
  • Silkie:大型视觉语言模型的偏好蒸馏
    PDF7 months ago
  • 歌词:通过语义感知视觉对象增强细粒度语言视觉对齐和理解
    PDF7 months ago
  • 大型视觉语言模型中的幻觉检测与预防
    PDFa year ago
Prev
Next