关键词large vision language models
搜索结果 - 25
  • MMArondight:使用自动生成的多模态越狱提示对大型视觉语言模型进行红队演练
    PDF6 days ago
  • ACL视觉语言模型中的多物体幻觉
    PDF19 days ago
  • Video-STaR:利用自训练实现任意监督下的视频指导调优
    PDF19 days ago
  • MedVH:面向医学环境中大型视觉语言模型的幻觉系统评估
    PDF24 days ago
  • D-Rax: 基于多模态数据和专家模型预测的特定领域放射助手
    PDF25 days ago
  • MedThink:通过思考减少幻觉的诱导医学大规模视觉语言模型
    PDFa month ago
  • 通过双模式对抗启示破解视觉语言模型
    PDF2 months ago
  • 利用图像理解的自我训练增强大型视觉语言模型
    PDF2 months ago
  • MetaToken: 通过元分类检测图像描述中的虚构
    PDF2 months ago
  • 不忘初心:大规模视觉语言模型的关注力视觉校准
    PDF2 months ago
  • RITUAL:随机图像变换作为 LVLM 中的通用抗幻觉杠杆
    PDF2 months ago
  • 通过精细的人工智能反馈检测和缓解大型视觉语言模型中的幻觉
    PDF3 months ago
  • ECOR:面向目标识别的可解释 CLIP
    PDF3 months ago
  • HOI-Ref:基于主体视角的手 - 物体交互引用
    PDF3 months ago
  • 利用大型语言和视觉模型通过程序生成的三维场景表示探索未知环境的机器人
    PDF4 months ago
  • CVPRSC-Tune:解锁大型视觉语言模型中的自洽参考理解
    PDF4 months ago
  • Griffon v2: 提升高分辨率缩放和视觉语言共识的多模态感知
    PDF4 months ago
  • 大型视觉语言模型中评估和缓解数字幻觉:一种一致性视角
    PDF5 months ago
  • 大型视觉语言模型的图像推理与描述的认知评估基准
    PDF5 months ago
  • Hal-Eval: 一个用于大型视觉语言模型的通用且精细的幻觉评估框架
    PDF5 months ago
Prev